Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

elvis
Створення за допомогою агентів штучного інтелекту @dair_ai • Попередня: Meta AI, Galactica LLM, Elastic, PaperswithCode, PhD • Я ділюся думками про те, як створювати за допомогою LLM та AI Agents ⬇️
Реальність така, що ми всі повинні намагатися створити власного ідеального агента-колегу.
Cowork від Anthropic сигналізує про нову хвилю інструментів оркестрації агентів на горизонті.
Йдеться не лише про те, щоб зробити використання Claude Code простим.
На мою думку, це більше про створення інтуїтивно зрозумілих інтерфейсів для взаємодії, управління та координації агентів, щоб вони були більш продуктивними з ШІ.
Є простір для інновацій у тому, як відбувається комунікація між людиною і агентом (і навпаки). І я маю на увазі скрізь і в кожній сфері, яку тільки можна уявити.
З появою навичок і плагінів кожен може створювати потужний досвід із цими агентами та інструментами. Не потрібно бути технічним, щоб порушувати і розвивати креативні й надзвичайно корисні навички (ні для роботи, ні для особистого проєкту, ні навіть для стартапу). Вам потрібно мати гарний смак у сфері, в якій ви працюєте, уважно стежити за новими технологіями ШІ, невпинно експериментувати, створювати контекст і будувати з підходом до складування.
Попереду захоплюючі часи. Час будувати!

81
Чи варто Agentic RAG того?
Системи RAG еволюціонували від простих конвеєрів ретривер-генератора до складних робочих процесів. Залишається незрозумілим, коли використовувати Enhanced RAG (фіксовані конвеєри з виділеними модулями) і Agentic RAG (LLM динамічно оркеструє весь процес).
Це дослідження є першим емпіричним порівнянням.
Покращений RAG додає заздалегідь визначені компоненти для усунення конкретних слабких місць: маршрутизатори для визначення необхідності пошуку, переписувачі запитів для покращення вирівнювання та реранкери для уточнення вибору документа. Робочий процес фіксований і проєктований вручну.
Agentic RAG має інший підхід. LLM вирішує, які дії виконувати, коли їх виконувати і чи ітерувати. Жодних додаткових компонентів, окрім базової бази знань, ретривера та генератора. Модель керує всім.
Дослідники оцінили обидві парадигми у чотирьох вимірах завдань контролю якості якості та інформаційного пошуку.
Обробка намірів користувача: Агент трохи перевершує Покращений у більшості завдань, але Покращений перемагає на FEVER (+28,8 очок F1), де агент часто отримує їх без потреби.
Переписування запитів: Agentic RAG отримує середній NDCG@10 55,6 порівняно з 52,8 у Enhanced, що показує, що агент може адаптивно переписувати запити, коли це вигідно.
Уточнення документів: Покращений RAG з переоцінкою (49,5 NDCG@10) перевершує Agentic (43,9). Спеціалізовані модулі переоцінки перевершують ітеративні спроби пошуку.
Agentic RAG набагато чутливіший до можливостей моделювання. У слабших моделях покращена RAG зберігає стабільність, тоді як продуктивність агентів суттєво погіршується.
Аналіз витрат показує, що агентний RAG потребує у 2-10 разів більше часу на обчислення та токенів через багатокрокове мислення.
Вибір між Enhanced і Agentic RAG залежить від ваших обмежень. Покращена RAG забезпечує передбачуваність, нижчі витрати та стабільність із слабшими моделями. Agentic RAG забезпечує гнучкість, але вимагає сильніших моделей і більшої обчислювальної потужності.
Стаття:
Навчіться створювати ефективні системи агентного RAG у нашій академії:

129
Просте рішення з пам'яттю для довгоперспективних завдань.

DAIR.AI15 січ., 22:22
Автономне управління пам'яттю в LLM-агентах
Агенти LLM мають труднощі з довгостроковими завданнями через перевантаження контексту.
Зі зростанням історії взаємодії обчислювальні витрати стрімко зростають, затримка зростає, а мислення погіршується через відволікання через нерелевантні минулі помилки.
Стандартний підхід — лише додавання: кожна думка, виклик інструменту та відповідь накопичуються назавжди. Це працює для коротких завдань, але гарантує невдачу для складного дослідження.
Це дослідження представляє Focus — архітектуру, орієнтовану на агенти, натхненну слизовою пліснявою (Physarum polycephalum). Біологічне розуміння: організми не зберігають ідеальних записів кожного руху через лабіринт. Вони зберігають отриману карту.
Focus дає агентам два нові примітиви: start_focus і complete_focus. Агент автономно вирішує, коли консолідувати знання у стійкий блок Знань, і активно обрізає сиру історію взаємодії. Жодних зовнішніх таймерів чи евристик, що змушують стискатися.
Вона декларує те, що ви досліджуєте, досліджує за стандартними інструментами, а потім консолідує шляхом узагальнення того, що було зроблено, чого було навчено та результат. Система додає це до постійного блоку Знань і видаляє все між контрольною точкою та поточним кроком.
Це перетворює монотонно зростаючий контекст на пилоподібний візерунок: ріст під час розвідки, колапс під час консолідації.
Оцінка на SWE-bench Lite з Claude Haiku 4.5 показує, що Focus досягає зменшення токенів на 22,7% (з 14,9 млн до 11,5 млн токенів), зберігаючи при цьому однакову точність (60% як для базового, так і для Focus). Окремі випадки показали заощадження до 57%.
Агресивне підштовхування має значення. Пасивне підказування приносило лише 6% економії. Чіткі інструкції для стиснення кожні 10-15 викликів інструментів із системними нагадуваннями збільшили стиснення з 2.0 до 6.0 на завдання.
Здатні моделі можуть автономно саморегулювати свій контекст, якщо їм надають відповідні інструменти та підказки, відкриваючи шляхи для агентних систем з урахуванням витрат без втрати продуктивності завдань.
Стаття:
Навчіться створювати ефективних агентів ШІ в нашій академії:

31
Найкращі
Рейтинг
Вибране
