Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

elvis
Rakentaminen tekoälyagenteilla @dair_ai • Edellinen: Meta AI, Galactica LLM, Elastic, PaperswithCode, PhD • Jaan näkemyksiä siitä, miten rakentaa LLM:ien ja tekoälyagenttien ⬇️ avulla
Todellisuus on, että meidän kaikkien pitäisi yrittää rakentaa oma ihanteellinen agenttityökaverimme.
Anthropic's Cowork ennakoi uutta aaltoa agenttien orkestrointityökaluja horisontissa.
Kyse ei ole pelkästään Claude-koodin helpoksi tekemisestä.
Mielestäni kyse on enemmän intuitiivisten käyttöliittymien rakentamisesta, joiden avulla agentit voivat olla vuorovaikutuksessa, hallittavassa ja orkestroimassa tekoälyn kanssa tuottavampia.
Ihmisen ja agentin välisessä viestinnässä (ja päinvastoin) on tilaa innovaatioille. Ja tarkoitan kaikkialla ja kaikilla alueilla, joita voit kuvitella.
Taitojen ja lisäosien yleistyessä kuka tahansa voi rakentaa tehokkaita kokemuksia näillä agenteilla ja työkaluilla. Sinun ei tarvitse olla tekninen muuttaaksesi ja rakentaaksesi luovia ja uskomattoman hyödyllisiä taitoja (työssä, henkilökohtaisessa projektissa tai jopa startupissa). Sinulla täytyy olla hyvä maku toimivalla alalla, kiinnittää erityistä huomiota kehittyvään tekoälyteknologiaan, kokeilla väsymättä, rakentaa kontekstia ja rakentaa yhdistetyllä ajattelutavalla.
Jännittäviä aikoja edessä. On aika rakentaa!

40
Onko Agentic RAG sen arvoinen?
RAG-järjestelmät ovat kehittyneet yksinkertaisista noutaja-generaattoriputkista kehittyneisiin työnkulkuihin. On edelleen epäselvää, milloin käyttää Enhanced RAG:ia (kiinteät putket omistetuilla moduuleilla) ja Agentic RAG:ia (LLM orkestroi koko prosessin dynaamisesti).
Tämä tutkimus tarjoaa ensimmäisen empiirisen vertailun.
Parannettu RAG lisää ennalta määritellyt komponentit tiettyjen heikkouksien korjaamiseen: reitittimet tarkistamaan haku tarpeen, kyselyiden uudelleenkirjoittajat kohdistuksen parantamiseksi ja sijoittajat dokumenttien valinnan hienosäätöön. Työnkulku on kiinteä ja manuaalisesti suunniteltu.
Agentic RAG lähestyy asiaa eri tavalla. LLM päättää, mitkä toiminnot suoritetaan, milloin ne suoritetaan ja iteroidaanko. Ei ylimääräisiä komponentteja perustietokannan, noutajan ja generaattorin lisäksi. Malli ohjaa kaikkea.
Tutkijat arvioivat molempia paradigmoja neljässä ulottuvuudessa laadunvarmistuksessa ja tiedonhakutehtävissä.
Käyttäjän intentiokäsittely: Agentic päihittää hieman Enhanced useimmissa tehtävissä, mutta Enhanced voittaa selvästi FEVERissä (+28,8 F1-pistettä), jossa agentti usein hakee tarpeettomasti.
Kyselyjen uudelleenkirjoitus: Agentic RAG saavuttaa keskimäärin 55,6 NDCG@10 verrattuna Enhanced 52,8:aan, mikä osoittaa, että agentti voi mukautuvasti kirjoittaa kyselyt uudelleen silloin kun se on hyödyllistä.
Asiakirjan hienosäätö: Parannettu RAG uudelleenluokituksella (49,5 NDCG@10) päihittää Agenticin (43,9). Omat reranker-moduulit voittavat iteratiiviset noutoyritykset.
Agentic RAG on paljon herkempi mallin ominaisuuksille. Heikommilla malleilla Enhanced RAG säilyttää vakauden, kun taas Agentic-suorituskyky heikkenee merkittävästi.
Kustannusanalyysi paljastaa, että Agentic RAG vaatii 2–10 kertaa enemmän laskentaaikaa ja tokeneita monivaiheisen päättelyn vuoksi.
Valinta Enhanced ja Agentic RAG:n välillä riippuu rajoitteistasi. Parannettu RAG tarjoaa ennustettavuutta, alhaisempia kustannuksia ja vakautta heikommilla malleilla. Agentic RAG tarjoaa joustavuutta, mutta vaatii vahvempia malleja ja enemmän laskentaa.
Artikkeli:
Opi rakentamaan tehokkaita Agentic RAG -järjestelmiä akatemiassamme:

88
Yksinkertainen muistiratkaisu pitkän aikavälin tehtäviin.

DAIR.AI15.1. klo 22.22
Autonominen muistinhallinta LLM-agenteissa
LLM-agentit kamppailevat pitkän aikavälin tehtävien kanssa kontekstin paisumisen vuoksi.
Kun vuorovaikutushistoria kasvaa, laskennalliset kustannukset räjähtivät räjähdysmäisesti, viive kasvaa ja päättely heikkenee merkityksettömien menneiden virheiden aiheuttaman häiriön vuoksi.
Tavanomainen lähestymistapa on vain liitännäinen: jokainen ajatus, työkalukutsu ja vastaus kertyy pysyvästi. Tämä toimii lyhyissä tehtävissä, mutta takaa epäonnistumisen monimutkaisessa tutkimuksessa.
Tämä tutkimus esittelee Focusin, agenttikeskeisen arkkitehtuurin, joka on saanut inspiraationsa limahomeesta (Physarum polycephalum). Biologinen oivallus: eliöt eivät säilytä täydellisiä tietoja jokaisesta liikkeestä labyrintissa. He säilyttävät opitun kartan.
Focus antaa agenteille kaksi uutta primitiiviä: start_focus ja complete_focus. Agentti päättää itsenäisesti, milloin opitut yhdistetään pysyvään tietolohkoon ja karsia aktiivisesti raakaa vuorovaikutushistoriaa. Ei ulkoisia ajastimia tai heuristiikkoja, jotka pakottaisivat pakkauksen.
Se ilmoittaa, mitä tutkit, tutkii tavanomaisilla työkaluilla ja tiivistää yhteen, mitä yritettiin, mitä opittiin ja mikä lopputulos on. Järjestelmä lisää tämän pysyvään tietolohkoon ja poistaa kaiken tarkistuspisteen ja nykyisen vaiheen välillä.
Tämä muuttaa monotonisesti kasvavan kontekstin sahahampaaksi: kasvu tutkimusmatkan aikana, romahdus konsolidoinnin aikana.
SWE-bench Lite -analyysi Claude Haiku 4.5:n kanssa osoittaa, että Focus saavuttaa 22,7 % tokenien vähennyksen (14,9 miljoonasta 11,5 miljoonaan tokenista) säilyttäen samalla identtisen tarkkuuden (60 % sekä perus- että Focus-mallissa). Yksittäiset tapaukset osoittivat säästöjä jopa 57 %.
Aggressiivinen kehotus on tärkeää. Passiivinen ohjaus toi vain 6 % säästöjä. Eksplisiittiset ohjeet pakata joka 10–15 työkalukutsun välein, järjestelmämuistutuksilla, lisäsivät pakkausarvoa 2.0:sta 6.0:aan per tehtävä.
Kykenevät mallit voivat itseohjata kontekstiaan itsenäisesti, kun niille annetaan sopivat työkalut ja kehotukset, avaten polkuja kustannustietoisille agenttijärjestelmille tinkimättä tehtävien suorituskyvystä.
Artikkeli:
Opettele rakentamaan tehokkaita tekoälyagentteja akatemiassamme:

2
Johtavat
Rankkaus
Suosikit
