To fantastyczny przykład ekosystemu ocen AI zaproponowanego przez plan działania AI @WhiteHouse od @DavidSacks @mkratsios47 @sriramk @deanwball wprowadzony w życie.
lmarena.ai
lmarena.ai19 sie, 20:03
🧬 BiomedArena jest tutaj! Jesteśmy zaszczyceni, że możemy współpracować z @DataTecnica i @NIH CARD, którzy opracowali BiomedArena, aby oceniać LLM-y w zakresie odkryć biomedycznych oraz pomóc w rozszerzeniu tego specyficznego toru w ocenach opartych na społeczności. 🧪 Nauka biomedyczna jest złożona, wiąże się z dużym ryzykiem i nieustannie się rozwija. 📊 CARDBiomedBench i testy rozumowania tabelarycznego pokazują, że żaden obecny model nie może wiarygodnie spełnić wymagań dotyczących rozumowania i wiedzy specyficznej dla dziedziny, które stawiają badacze biomedyczni. Dowiedz się więcej o BiomedArena w wątku 👇 🧵 #AI #LLMs #BiomedicalAI #AIEvaluation #OpenScience #LMArena #BiomedArena #NIH
1,56K