これは、@DavidSacks @mkratsios47 @sriramk @deanwballのAIアクションプランによって提案されたAI評価エコシステム@WhiteHouse実行に移された素晴らしい例です
lmarena.ai
lmarena.ai8月19日 20:03
🧬 バイオメッドアリーナが登場! 生物医学的発見のためのLLMを評価するためにBiomedArenaを開発した@DataTecnicaおよび@NIH CARDと提携し、コミュニティ主導の評価におけるこのドメイン固有のトラックの拡大を支援できることを光栄に思います。 🧪 生物医学は複雑で一か八かであり、常に進化しています。 📊 CARDBiomedBenchと表形式の推論テストは、生物医学研究者の推論とドメイン固有の知識の要求を確実に満たすことができる現在のモデルはないことを示しています。 スレッド👇 🧵でBiomedArenaの詳細 #AI #LLMs #BiomedicalAI #AIEvaluation #OpenScience #LMArena #BiomedArena #NIH
1.53K