Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

elvis
Сборка с помощью агентов ИИ @dair_ai • Предыдущая: Meta AI, Galactica LLM, Elastic, PaperswithCode, PhD • Я делюсь идеями о том, как создавать с помощью LLM и агентов ⬇️ ИИ
Реальность такова, что нам всем следует стремиться создать своего идеального агентного коллегу.
Cowork от Anthropic сигнализирует о новой волне инструментов оркестрации агентов на горизонте.
Дело не только в том, чтобы сделать использование Claude Code простым.
На мой взгляд, это больше связано с созданием интуитивно понятных интерфейсов для взаимодействия, управления и оркестрации агентов, чтобы они были более продуктивными с AI.
Существует пространство для инноваций в том, как происходит коммуникация между человеком и агентом (и наоборот). И я имею в виду повсюду и в каждой области, которую вы можете себе представить.
С ростом навыков и плагинов любой может создать мощные впечатления с этими агентами и инструментами. Вам не нужно быть техническим специалистом, чтобы нарушить правила и создать креативные и невероятно полезные навыки (будь то для работы, личного проекта или даже стартапа). Вам нужно иметь хороший вкус в области, в которой вы работаете, внимательно следить за новыми технологиями AI, без усталости экспериментировать, создавать контекст и строить с компаундным мышлением.
Впереди захватывающие времена. Пора строить!

85
Стоит ли использовать Agentic RAG?
Системы RAG эволюционировали от простых конвейеров извлечения и генерации к сложным рабочим процессам. По-прежнему неясно, когда использовать Enhanced RAG (фиксированные конвейеры с выделенными модулями) по сравнению с Agentic RAG (LLM динамически управляет всем процессом).
Это исследование предоставляет первое эмпирическое сравнение.
Enhanced RAG добавляет заранее определенные компоненты для устранения конкретных слабостей: маршрутизаторы для определения необходимости извлечения, переписчики запросов для улучшения согласованности и повторные ранжировщики для уточнения выбора документов. Рабочий процесс фиксирован и вручную спроектирован.
Agentic RAG использует другой подход. LLM решает, какие действия выполнять, когда их выполнять и нужно ли повторять. Нет дополнительных компонентов, кроме базовой базы знаний, извлекателя и генератора. Модель контролирует все.
Исследователи оценили оба парадигмы по четырем измерениям в задачах QA и извлечения информации.
Обработка намерений пользователя: Agentic немного превосходит Enhanced по большинству задач, но Enhanced одерживает решительную победу на FEVER (+28.8 F1 баллов), где агент часто извлекает ненужные данные.
Переписывание запросов: Agentic RAG достигает 55.6 в среднем NDCG@10 по сравнению с 52.8 для Enhanced, что показывает, что агент может адаптивно переписывать запросы, когда это полезно.
Уточнение документов: Enhanced RAG с повторным ранжированием (49.5 NDCG@10) превосходит Agentic (43.9). Специальные модули повторного ранжирования превосходят итеративные попытки извлечения.
Agentic RAG гораздо более чувствителен к возможностям модели. С более слабыми моделями Enhanced RAG сохраняет стабильность, в то время как производительность Agentic значительно ухудшается.
Анализ затрат показывает, что Agentic RAG требует в 2-10 раз больше времени вычислений и токенов из-за многоступенчатого рассуждения.
Выбор между Enhanced и Agentic RAG зависит от ваших ограничений. Enhanced RAG предлагает предсказуемость, более низкие затраты и стабильность с более слабыми моделями. Agentic RAG предоставляет гибкость, но требует более мощных моделей и больше вычислительных ресурсов.
Статья:
Научитесь строить эффективные системы Agentic RAG в нашей академии:

133
Простое решение для памяти для задач с длительным горизонтом.

DAIR.AI15 янв., 22:22
Автономное управление памятью в агентах LLM
Агенты LLM испытывают трудности с задачами долгосрочной перспективы из-за разрастания контекста.
По мере роста истории взаимодействия вычислительные затраты взлетают, увеличивается задержка, а рассуждения ухудшаются из-за отвлечения на неуместные прошлые ошибки.
Стандартный подход — только добавление: каждая мысль, вызов инструмента и ответ накапливаются навсегда. Это работает для коротких задач, но гарантирует неудачу для сложной разведки.
Это исследование представляет Focus, архитектуру, ориентированную на агента, вдохновленную слизевиком (Physarum polycephalum). Биологическая идея: организмы не сохраняют идеальные записи о каждом движении через лабиринт. Они сохраняют изученную карту.
Focus предоставляет агентам два новых примитива: start_focus и complete_focus. Агент самостоятельно решает, когда консолидировать знания в постоянный блок Знаний и активно очищает сырую историю взаимодействия. Нет внешних таймеров или эвристик, заставляющих сжимать.
Он объявляет, что вы исследуете, исследует с использованием стандартных инструментов, а затем консолидирует, подводя итоги того, что было попытано, что было изучено и каков был результат. Система добавляет это в постоянный блок Знаний и удаляет все между контрольной точкой и текущим шагом.
Это преобразует монотонно увеличивающийся контекст в зубчатый паттерн: рост во время исследования, коллапс во время консолидации.
Оценка на SWE-bench Lite с Claude Haiku 4.5 показывает, что Focus достигает 22.7% сокращения токенов (с 14.9M до 11.5M токенов), сохраняя идентичную точность (60% как для базового уровня, так и для Focus). Отдельные случаи показали экономию до 57%.
Агрессивное побуждение имеет значение. Пассивное побуждение дало лишь 6% экономии. Явные инструкции сжимать каждые 10-15 вызовов инструмента, с напоминаниями системы, увеличили сжатия с 2.0 до 6.0 на задачу.
Способные модели могут автономно саморегулировать свой контекст, когда им предоставлены соответствующие инструменты и побуждения, открывая пути для систем, учитывающих затраты, без ущерба для производительности задач.
Статья:
Научитесь создавать эффективных AI-агентов в нашей академии:

35
Топ
Рейтинг
Избранное
