Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Чи варто Agentic RAG того?
Системи RAG еволюціонували від простих конвеєрів ретривер-генератора до складних робочих процесів. Залишається незрозумілим, коли використовувати Enhanced RAG (фіксовані конвеєри з виділеними модулями) і Agentic RAG (LLM динамічно оркеструє весь процес).
Це дослідження є першим емпіричним порівнянням.
Покращений RAG додає заздалегідь визначені компоненти для усунення конкретних слабких місць: маршрутизатори для визначення необхідності пошуку, переписувачі запитів для покращення вирівнювання та реранкери для уточнення вибору документа. Робочий процес фіксований і проєктований вручну.
Agentic RAG має інший підхід. LLM вирішує, які дії виконувати, коли їх виконувати і чи ітерувати. Жодних додаткових компонентів, окрім базової бази знань, ретривера та генератора. Модель керує всім.
Дослідники оцінили обидві парадигми у чотирьох вимірах завдань контролю якості якості та інформаційного пошуку.
Обробка намірів користувача: Агент трохи перевершує Покращений у більшості завдань, але Покращений перемагає на FEVER (+28,8 очок F1), де агент часто отримує їх без потреби.
Переписування запитів: Agentic RAG отримує середній NDCG@10 55,6 порівняно з 52,8 у Enhanced, що показує, що агент може адаптивно переписувати запити, коли це вигідно.
Уточнення документів: Покращений RAG з переоцінкою (49,5 NDCG@10) перевершує Agentic (43,9). Спеціалізовані модулі переоцінки перевершують ітеративні спроби пошуку.
Agentic RAG набагато чутливіший до можливостей моделювання. У слабших моделях покращена RAG зберігає стабільність, тоді як продуктивність агентів суттєво погіршується.
Аналіз витрат показує, що агентний RAG потребує у 2-10 разів більше часу на обчислення та токенів через багатокрокове мислення.
Вибір між Enhanced і Agentic RAG залежить від ваших обмежень. Покращена RAG забезпечує передбачуваність, нижчі витрати та стабільність із слабшими моделями. Agentic RAG забезпечує гнучкість, але вимагає сильніших моделей і більшої обчислювальної потужності.
Стаття:
Навчіться створювати ефективні системи агентного RAG у нашій академії:

Найкращі
Рейтинг
Вибране
