Dette er et fantastisk eksempel på økosystemet for AI-evalueringer foreslått av @WhiteHouse AI-handlingsplan fra @DavidSacks @mkratsios47 @sriramk @deanwball blir satt ut i livet
lmarena.ai
lmarena.ai19. aug., 20:03
🧬 BiomedArena er her! Vi er beæret over å samarbeide med @DataTecnica og @NIH CARD, som utviklet BiomedArena for å evaluere LLM-er for biomedisinsk oppdagelse, og for å bidra til å utvide dette domenespesifikke sporet i fellesskapsdrevne evalueringer. 🧪 Biomedisinsk vitenskap er kompleks, høy innsats og i stadig utvikling. 📊 CARDBiomedBench og tabellresonneringstester viser at ingen nåværende modell på en pålitelig måte kan møte resonnement- og domenespesifikke kunnskapskrav til biomedisinske forskere. Lær mer om BiomedArena i tråden 👇 🧵 #AI #LLMs #BiomedicalAI #AIEvaluation #OpenScience #LMArena #BiomedArena #NIH
1,5K