Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Nous Research
Nous Research przedstawia Hermes 4, naszą najnowszą linię hybrydowych modeli rozumowania.
Hermes 4 opiera się na naszym dziedzictwie modeli dostosowanych do użytkowników, z rozszerzonymi możliwościami obliczeniowymi w czasie testów.
Szczególną uwagę poświęcono temu, aby modele były kreatywne i interesujące w interakcji, nieobciążone cenzurą oraz neutralnie dostosowane, przy jednoczesnym utrzymaniu najwyższego poziomu matematyki, kodowania i wydajności rozumowania dla modeli o otwartych wagach.

10,73K
Użytkownik Nous Research udostępnił ponownie
1/10🧵 @nousresearch niedawno opublikował interesujące badanie, które pokazuje, że otwarte modele używają 2-3 razy więcej tokenów niż modele zamknięte w zadaniach rozumowania.
Sprawdziliśmy, czy dynamiczna alokacja tokenów może pomóc w rozwiązaniu tej luki wydajnościowej. Oto, czego się nauczyliśmy 👇
8,02K
Mierzenie efektywności myślenia w modelach rozumowania: brakujący benchmark
Mierzyliśmy wykorzystanie tokenów w modelach rozumowania: modele otwarte generują od 1,5 do 4 razy więcej tokenów niż modele zamknięte w identycznych zadaniach, ale z ogromną zmiennością w zależności od typu zadania (nawet do 10 razy w przypadku prostych pytań).
Ten ukryty koszt często niweluje zalety cenowe za token. Efektywność tokenów powinna stać się głównym celem obok benchmarków dokładności, zwłaszcza biorąc pod uwagę przypadki użycia, które nie dotyczą rozumowania.
Przeczytaj dokładny przegląd efektywności rozumowania w kontekście modeli otwartych i zamkniętych w naszym najnowszym wpisie na blogu, stworzonym we współpracy z naszym badaczem rezydentem, Timem.
Zobacz więcej ich prac tutaj:

48,7K
Użytkownik Nous Research udostępnił ponownie
Środowisko oceny Arena-Hard zostało teraz połączone z Atropos - ciesz się skalowalną, elastyczną i nowoczesną oceną dzięki benchmarkowi arena-hard od @lmsysorg, który doskonale określa szeroki zakres możliwości modeli.
Gotowe, aby stać się środowiskiem RL, jeśli przyniesiesz własny zestaw treningowy :)
Dowiedz się więcej na

6,95K
Nasz badacz rezydent @yaboilyrical będzie omawiał swoją pracę nad kierowaniem SMC na UC Berkeley 3 sierpnia.
Sprawdź bloga na temat tej pracy tutaj:
Szczegóły poniżej!

nightwing25 lip 2025
z radością ogłaszam, że będę mówcą na szczycie DeAI @BerkeleyRDI, prezentując moje badania z @NousResearch na temat ograniczonego dekodowania języka!
jeśli wybierasz się na szczyt lub chcesz przyjść na moją prezentację, skontaktuj się ze mną!

10,97K
Najlepsze
Ranking
Ulubione
Trendy onchain
Trendy na X
Niedawne największe finansowanie
Najbardziej godne uwagi