Questo è un fantastico esempio dell'ecosistema di valutazioni AI proposto dal piano d'azione AI della @WhiteHouse da @DavidSacks @mkratsios47 @sriramk @deanwball messo in atto.
lmarena.ai
lmarena.ai19 ago, 20:03
🧬 BiomedArena è qui! Siamo onorati di collaborare con @DataTecnica e @NIH CARD, che hanno sviluppato BiomedArena per valutare i LLM per la scoperta biomedica e per aiutare ad espandere questo percorso specifico del dominio nelle valutazioni guidate dalla comunità. 🧪 La scienza biomedica è complessa, ad alto rischio e in continua evoluzione. 📊 CARDBiomedBench e i test di ragionamento tabellare mostrano che nessun modello attuale può soddisfare in modo affidabile le esigenze di ragionamento e conoscenza specifica del dominio dei ricercatori biomedici. Scopri di più su BiomedArena nel thread 👇 🧵 #AI #LLMs #BiomedicalAI #AIEvaluation #OpenScience #LMArena #BiomedArena #NIH
1,52K