Este es un ejemplo fantástico del ecosistema de evaluaciones de IA propuesto por @WhiteHouse plan de acción de IA de @DavidSacks @mkratsios47 @sriramk @deanwball que se pone en práctica
lmarena.ai
lmarena.ai19 ago, 20:03
🧬 ¡BiomedArena está aquí! Nos sentimos honrados de asociarnos con @DataTecnica y @NIH CARD, quienes desarrollaron BiomedArena para evaluar los LLM para el descubrimiento biomédico y ayudar a expandir esta pista específica del dominio en evaluaciones impulsadas por la comunidad. 🧪 La ciencia biomédica es compleja, de alto riesgo y en constante evolución. 📊 Las pruebas de razonamiento tabular y CARDBiomedBench muestran que ningún modelo actual puede satisfacer de manera confiable las demandas de razonamiento y conocimiento específico del dominio de los investigadores biomédicos. Más información sobre BiomedArena en hilo 👇 🧵 #AI #LLMs #BiomedicalAI #AIEvaluation #OpenScience #LMArena #BiomedArena #NIH
1.53K