Ini adalah contoh fantastis dari ekosistem evaluasi AI yang diusulkan oleh rencana aksi AI @WhiteHouse dari @DavidSacks @mkratsios47 @sriramk @deanwball dilaksanakan
lmarena.ai
lmarena.ai19 Agu, 20.03
🧬 BiomedArena ada di sini! Kami merasa terhormat dapat bermitra dengan @DataTecnica dan @NIH CARD, yang mengembangkan BiomedArena untuk mengevaluasi LLM untuk penemuan biomedis, dan untuk membantu memperluas jalur khusus domain ini dalam evaluasi berbasis komunitas. 🧪 Ilmu biomedis kompleks, berisiko tinggi, dan terus berkembang. 📊 CARDBiomedBench & tes penalaran tabular menunjukkan bahwa tidak ada model saat ini yang dapat dengan andal memenuhi tuntutan penalaran & pengetahuan khusus domain dari peneliti biomedis. Pelajari lebih lanjut tentang BiomedArena di utas 👇 🧵 #AI #LLMs #BiomedicalAI #AIEvaluation #OpenScience #LMArena #BiomedArena #NIH
1,52K