🧬 ¡BiomedArena está aquí! Nos sentimos honrados de asociarnos con @DataTecnica y @NIH CARD, quienes desarrollaron BiomedArena para evaluar los LLM para el descubrimiento biomédico y ayudar a expandir esta pista específica del dominio en evaluaciones impulsadas por la comunidad. 🧪 La ciencia biomédica es compleja, de alto riesgo y en constante evolución. 📊 Las pruebas de razonamiento tabular y CARDBiomedBench muestran que ningún modelo actual puede satisfacer de manera confiable las demandas de razonamiento y conocimiento específico del dominio de los investigadores biomédicos. Más información sobre BiomedArena en hilo 👇 🧵 #AI #LLMs #BiomedicalAI #AIEvaluation #OpenScience #LMArena #BiomedArena #NIH
16.35K