Sklep DApp | Centrum Web3 dla wydarzeń i gier

Popularne tematy

🤖Przedstawiamy OptimalThinkingBench 🤖 📝: - Myślące LLM-y używają wielu tokenów i zbytnio analizują; nie-myślące LLM-y myślą zbyt mało i osiągają słabe wyniki. - Wprowadzamy benchmark, który ocenia modele w poszukiwaniu najlepszego miksu. - OptimalThinkingBench raportuje wynik F1 łącząc OverThinkingBench (proste zapytania w 72 dziedzinach) i UnderThinkingBench (11 trudnych zadań rozumowania). - Oceniamy 33 różne modele SOTA i stwierdzamy, że potrzebne są poprawki! 🧵1/5

61,13K

Najlepsze

Ranking

Ulubione

Trendy onchain

Trendy na X

Niedawne największe finansowanie

Najbardziej godne uwagi