Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Nous Research
Nous Research представляє Hermes 4, нашу останню лінійку моделей гібридного міркування.
Hermes 4 ґрунтується на нашій спадщині моделей, орієнтованих на користувача, з розширеними можливостями обчислень під час тестування.
Особлива увага була приділена тому, щоб зробити моделі творчими та цікавими у взаємодії, не обтяженими цензурою та нейтрально узгодженими, зберігаючи при цьому найсучасніший рівень продуктивності математики, кодування та міркування для моделей з відкритою вагою.

10,7K
Користувач Nous Research поділився
Нещодавно 1/10🧵 @nousresearch опублікував цікаве дослідження, яке показало, що відкриті моделі використовують в 2-3 рази більше токенів, ніж закриті моделі для завдань на міркування.
Ми перевірили, чи може динамічний розподіл токенів допомогти усунути цю прогалину в ефективності. Що ми дізналися 👇
8,02K
Вимірювання ефективності мислення в моделях міркувань: відсутній орієнтир
Ми виміряли використання токенів у моделях міркувань: відкриті моделі видають у 1,5-4 рази більше токенів, ніж закриті моделі на ідентичні завдання, але з величезною дисперсією залежно від типу завдання (до 10 разів на прості запитання).
Ця прихована вартість часто зводить нанівець переваги ціноутворення за токен. Ефективність токенів повинна стати основною метою поряд з контрольними показниками точності, особливо з урахуванням випадків використання, не пов'язаних з обґрунтуванням.
Прочитайте детальний огляд ефективності міркувань у відкритому та закритому модельному ландшафті в нашому останньому дописі в блозі у співпраці з нашим дослідником за місцем проживання Тімом.
Більше їхніх робіт дивіться тут:

48,67K
Користувач Nous Research поділився
Eval оточення Arena-Hard тепер об'єднано з Atropos - насолоджуйтесь масштабованою, гнучкою та сучасною оцінкою за допомогою тесту @lmsysorg arena-hard, який дуже чудово визначає широкий спектр можливостей у моделях.
Будьте готові стати середовищем RL, якщо ви візьмете з собою власний потяг, а також :)
Дізнайтеся більше на

6,94K
Наш дослідник у резиденції @yaboilyrical обговорить свою роботу з управління SMC в Каліфорнійському університеті в Берклі 3 серпня.
Перегляньте блог про цю роботу тут:
Подробиці нижче!

nightwing25 лип. 2025 р.
З радістю повідомляю, що буду доповідачем на саміті DeAI Summit @BerkeleyRDI, представляючи своє дослідження з @NousResearch щодо обмеженого декодування мови!
Якщо ви відвідуєте саміт або хочете прийти подивитися на мій виступ, будь ласка, зв'яжіться зі мною!

10,94K
Найкращі
Рейтинг
Вибране
Актуальне ончейн
Популярні в X
Нещодавнє найкраще фінансування
Найбільш варте уваги