Чи варто Agentic RAG того? Системи RAG еволюціонували від простих конвеєрів ретривер-генератора до складних робочих процесів. Залишається незрозумілим, коли використовувати Enhanced RAG (фіксовані конвеєри з виділеними модулями) і Agentic RAG (LLM динамічно оркеструє весь процес). Це дослідження є першим емпіричним порівнянням. Покращений RAG додає заздалегідь визначені компоненти для усунення конкретних слабких місць: маршрутизатори для визначення необхідності пошуку, переписувачі запитів для покращення вирівнювання та реранкери для уточнення вибору документа. Робочий процес фіксований і проєктований вручну. Agentic RAG має інший підхід. LLM вирішує, які дії виконувати, коли їх виконувати і чи ітерувати. Жодних додаткових компонентів, окрім базової бази знань, ретривера та генератора. Модель керує всім. Дослідники оцінили обидві парадигми у чотирьох вимірах завдань контролю якості якості та інформаційного пошуку. Обробка намірів користувача: Агент трохи перевершує Покращений у більшості завдань, але Покращений перемагає на FEVER (+28,8 очок F1), де агент часто отримує їх без потреби. Переписування запитів: Agentic RAG отримує середній NDCG@10 55,6 порівняно з 52,8 у Enhanced, що показує, що агент може адаптивно переписувати запити, коли це вигідно. Уточнення документів: Покращений RAG з переоцінкою (49,5 NDCG@10) перевершує Agentic (43,9). Спеціалізовані модулі переоцінки перевершують ітеративні спроби пошуку. Agentic RAG набагато чутливіший до можливостей моделювання. У слабших моделях покращена RAG зберігає стабільність, тоді як продуктивність агентів суттєво погіршується. Аналіз витрат показує, що агентний RAG потребує у 2-10 разів більше часу на обчислення та токенів через багатокрокове мислення. Вибір між Enhanced і Agentic RAG залежить від ваших обмежень. Покращена RAG забезпечує передбачуваність, нижчі витрати та стабільність із слабшими моделями. Agentic RAG забезпечує гнучкість, але вимагає сильніших моделей і більшої обчислювальної потужності. Стаття: Навчіться створювати ефективні системи агентного RAG у нашій академії: