DApp Store | Hub da Web3 para eventos e jogos

Tópicos em alta

🤖Apresentando o OptimalThinkingBench 🤖 📝: - LLMs pensantes usam muitos tokens e pensam demais; LLMs que não pensam subestimam e têm um desempenho inferior. - Apresentamos um benchmark que pontua os modelos na busca para encontrar a melhor combinação. - O OptimalThinkingBench relata a pontuação F1 misturando OverThinkingBench (consultas simples em 72 domínios) e UnderThinkingBench (11 tarefas de raciocínio desafiadoras). - Avaliamos 33 modelos SOTA diferentes e achamos que são necessárias melhorias! 🧵1/5

61,14K

Melhores

Classificação

Favoritos

Em alta on-chain

Em alta no X

Principais fundos da atualidade

Mais notável