Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

elvis
Budování s agenty AI @dair_ai • Předchozí: Meta AI, Galactica LLM, Elastic, PaperswithCode, PhD • Sdílím poznatky o tom, jak stavět s LLM a AI agenty ⬇️
Realita je taková, že bychom si všichni měli budovat svého ideálního agentského kolegu.
Anthropicův Cowork signalizuje novou vlnu nástrojů pro orchestraci agentů na obzoru.
Nejde jen o to, aby bylo snadné používat Claude Code.
Podle mě jde spíš o vytváření intuitivních rozhraní pro interakci, správu a orchestraci agentů, aby byli s AI produktivnější.
Existuje prostor pro inovace v tom, jak probíhá komunikace mezi člověkem a agentem (a naopak). A myslím tím všude a v každé oblasti, jakou si dokážete představit.
S nástupem dovedností a pluginů může kdokoli vytvářet silné zážitky s těmito agenty a nástroji. Nemusíte být technicky zdatní, abyste narušili a budovali kreativní a neuvěřitelně užitečné dovednosti (ať už pro práci, osobní projekt nebo dokonce startup). Musíte mít dobrý vkus v oblasti, kterou působíte, věnovat pozornost vznikajícím AI technologiím, neúnavně experimentovat, budovat kontext a stavět s komplexním přístupem.
Čekají nás vzrušující časy. Je čas stavět!

54
Stojí Agentic RAG za to?
RAG systémy se vyvinuly od jednoduchých pipeline retriever-generátor k sofistikovaným workflow. Stále není jasné, kdy použít Enhanced RAG (pevné pipeline s dedikovanými moduly) a kdy Agentic RAG (LLM orchestruje celý proces dynamicky).
Tento výzkum poskytuje první empirické srovnání.
Vylepšený RAG přidává předdefinované komponenty pro řešení specifických slabin: routery pro určení, zda je potřeba vyhledávání, přepisovače dotazů pro zlepšení zarovnání a rerankery pro zpřesnění výběru dokumentů. Pracovní postup je pevný a ručně navržený.
Agentic RAG přistupuje k tomu jinak. LLM rozhoduje, které akce provést, kdy je provést a zda se má iterovat. Žádné další komponenty kromě základní znalostní báze, retrívra a generátoru. Model ovládá všechno.
Výzkumníci hodnotili oba paradigmata ve čtyřech dimenzích QA a úkolů vyhledávání informací.
Manipulace s uživatelským záměrem: Agentic mírně překonává Enhanced ve většině úkolů, ale Enhanced rozhodně vítězí ve FEVER (+28,8 F1 bodů), kde agent často zbytečně získává.
Přepisování dotazů: Agentic RAG dosahuje průměrných NDCG@10 55,6 oproti 52,8 u Enhanced, což ukazuje, že agent dokáže adaptivně přepisovat dotazy, když je to prospěšné.
Zpřesnění dokumentů: Vylepšený RAG s přehodnocením (49,5 NDCG@10) překonává Agentic (43,9). Dedikované reranker moduly překonávají iterativní pokusy o vyhledávání.
Agentický RAG je mnohem citlivější na schopnosti modelu. U slabších modelů si vylepšený RAG udržuje stabilitu, zatímco výkon Agentic výrazně klesá.
Analýza nákladů ukazuje, že Agentic RAG vyžaduje 2–10krát více výpočetního času a tokenů kvůli vícestupňovému uvažování.
Volba mezi Enhanced a Agentic RAG závisí na vašich omezeních. Vylepšený RAG nabízí předvídatelnost, nižší náklady a stabilitu i u slabších modelů. Agentic RAG poskytuje flexibilitu, ale vyžaduje silnější modely a více výpočetního výkonu.
Článek:
Naučte se vytvářet efektivní Agentic RAG systémy v naší akademii:

101
Jednoduché řešení s pamětí pro úkoly s dlouhým horizontem.

DAIR.AI15. 1. 22:22
Autonomní správa paměti u LLM agentů
LLM agenti mají potíže s úkoly s dlouhým horizontem kvůli přebytečnosti kontextu.
S rostoucí historií interakcí explodují výpočetní náklady, latence roste a uvažování se zhoršuje kvůli rozptýlení nerelevantními minulými chybami.
Standardní přístup je pouze s připojením: každá myšlenka, výzva k nástroji a odpověď se trvale hromadí. To funguje u krátkých úkolů, ale zaručuje neúspěch u složitého průzkumu.
Tento výzkum představuje Focus, architekturu zaměřenou na agenta inspirovanou slizovitou plísní (Physarum polycephalum). Biologický poznatek: organismy si neuchovávají dokonalé záznamy o každém pohybu bludištěm. Zachovávají si naučenou mapu.
Focus dává agentům dva nové primitivní schopnosti: start_focus a complete_focus. Agent autonomně rozhoduje, kdy konsoliduje poznatky do trvalého bloku znalostí, a aktivně ořezává surovou historii interakcí. Žádné vnější časovače ani heuristiky nutící kompresi.
Uvádí, co zkoumáte, zkoumá pomocí standardních nástrojů a poté konsoliduje shrnutím, co bylo zkoušeno, co bylo zjištěno a jaký byl výsledek. Systém to přidá k trvalému bloku znalostí a smaže vše mezi kontrolním bodem a aktuálním krokem.
To monotónně převádí rostoucí kontext do zubatého vzoru: růst během průzkumu, kolaps při konsolidaci.
Hodnocení SWE-bench Lite s Claudem Haiku 4.5 ukazuje, že Focus dosahuje snížení tokenů o 22,7 % (14,9 milionu na 11,5 milionu tokenů) při zachování stejné přesnosti (60 % pro základní a Focus). Jednotlivé případy ukázaly úspory až do 57 %.
Agresivní pobídky jsou důležité. Pasivní podněty přinesly úspory pouze 6 %. Explicitní instrukce pro kompresi každých 10–15 volání nástrojů s připomínkami systému zvýšily komprese z 2,0 na 6,0 na úkol.
Schopné modely mohou autonomně regulovat svůj kontext, pokud mají k dispozici vhodné nástroje a podněty, čímž otevírají cesty pro nákladově uvědomělé agentické systémy, aniž by obětovaly výkon úkolů.
Článek:
Naučte se vytvářet efektivní AI agenty v naší akademii:

14
Top
Hodnocení
Oblíbené
