DApp Store | Piattaforma Web3 per eventi e giochi

Argomenti di tendenza

🤖Presentiamo OptimalThinkingBench 🤖 📝: - I LLMs che pensano usano molti token e riflettono troppo; i LLMs non pensanti riflettono poco e non performano bene. - Introduciamo un benchmark che valuta i modelli nella ricerca della migliore combinazione. - OptimalThinkingBench riporta il punteggio F1 mescolando OverThinkingBench (query semplici in 72 domini) e UnderThinkingBench (11 compiti di ragionamento impegnativi). - Valutiamo 33 diversi modelli SOTA e troviamo che sono necessari miglioramenti! 🧵1/5

61,11K

Principali

Ranking

Preferiti

On-chain di tendenza

Di tendenza su X

Principali fondi recenti

Più popolari