🧬 ¡BiomedArena está aquí! Nos sentimos honrados de asociarnos con @DataTecnica y @NIH CARD, quienes desarrollaron BiomedArena para evaluar LLMs para el descubrimiento biomédico y ayudar a expandir esta pista específica del dominio en evaluaciones impulsadas por la comunidad. 🧪 La ciencia biomédica es compleja, de alto riesgo y está en constante evolución. 📊 CARDBiomedBench y las pruebas de razonamiento tabular muestran que ningún modelo actual puede satisfacer de manera confiable las demandas de razonamiento y conocimiento específico del dominio de los investigadores biomédicos. Aprende más sobre BiomedArena en el hilo 👇 🧵 #AI #LLMs #BiomedicalAI #AIEvaluation #OpenScience #LMArena #BiomedArena #NIH
16,35K