Trend Olan Konular
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

elvis
Yapay Zeka Ajanları ile İnşa @dair_ai • Önce: Meta AI, Galactica LLM, Elastic, PaperswithCode, PhD • LLM'ler ve AI Ajanları ⬇️ ile nasıl inşa edileceği hakkında görüşler paylaşıyorum
Gerçek şu ki, hepimiz kendi ideal ajanik iş arkadaşımızı oluşturmaya çalışmalıyız.
Anthropic'in Cowork'u, ufukta yeni bir ajan orkestrasyon araçları dalgasının işareti oluyor.
Sadece Claude Code'u kullanmayı kolaylaştırmakla ilgili değil.
Bence, daha çok yapay zeka ile daha verimli olmaları için ajanları etkileşime girmek, yönetmek ve düzenlemek için sezgisel arayüzler inşa etmekle ilgili.
İnsan-ajan-ajan (ve tam tersi) iletişiminin gerçekleşmesinde yenilik için alan var. Ve yani hayal edebileceğiniz her yerde ve her alanda.
Beceriler ve eklentilerin yükselişiyle birlikte, herkes bu ajanlar ve araçlarla güçlü deneyimler oluşturabilir. Yaratıcı ve inanılmaz faydalı beceriler geliştirmek için (ister iş, kişisel proje ya da hatta bir startup için) teknik olmanıza gerek yok. Çalıştığınız alanda iyi bir zevke sahip olmalısınız, yeni ortaya çıkan yapay zeka teknolojisine dikkat etmelisiniz, durmaksızın deney yapmanız, bağlam oluşturmanız ve bileşik bir zihniyetle inşa etmeniz gerekir.
Heyecan verici zamanlar geliyor. İnşa zamanı!

57
Agentic RAG buna değer mi?
RAG sistemleri, basit alıcı-jeneratör boru hatlarından gelişmiş iş akışlarına evrilmiştir. Enhanced RAG (özel modüllü sabit boru hatları) ile Ajanic RAG (LLM tüm süreci dinamik olarak yönetir) ne zaman kullanılacağı belirsizdir.
Bu araştırma ilk ampirik karşılaştırmayı sağlar.
Geliştirilmiş RAG, belirli zayıflıkları gidermek için önceden tanımlanmış bileşenler ekler: yönlendiriciler için geri alma gerekliliğini belirler, sorgu yeniden yazıcılar hizalamayı iyileştirmek için ve yeniden sıralama oluşturucular belge seçimini iyileştirmek için. İş akışı sabit ve manuel olarak tasarlandı.
Agentic RAG farklı bir yaklaşım benimser. LLM, hangi eylemleri gerçekleştireceğine, ne zaman yapılacağına ve yineleme yapıp yapılmayacağına karar verir. Temel bilgi tabanı, retriever ve jeneratör dışında ekstra bileşen yok. Model her şeyi kontrol ediyor.
Araştırmacılar, her iki paradigmayı dört boyutta QA ve bilgi arama görevlerinde değerlendirdi.
Kullanıcı niyet yönetimi: Ajanik, çoğu görevde Enchane'den biraz daha iyi performans gösterirken, Enhanced FEVER'de (+28.8 F1 puan) kesin bir şekilde kazanır; ajan genellikle gereksiz yere geri alır.
Sorgu yeniden yazma: Ajanic RAG, Enhanced için ortalama 55,6 NDCG@10 sağlarken, bu da ajanın faydalı olduğunda sorguları uyarlayıcı olarak yeniden yazabildiğini gösterir.
Belge iyileştirmesi: Yeniden sıralama ile geliştirilmiş RAG (49,5 NDCG@10) Agentic'ten (43,9) daha iyi performans gösterir. Özel reranker modülleri, yinelemeli geri alma denemelerini geride bırakıyor.
Ajanik RAG model yeteneğine çok daha duyarlıdır. Daha zayıf modellerde, Enhanced RAG stabiliteyi korurken, Ajanic performansı önemli ölçüde düşer.
Maliyet analizi, Agentic RAG'ın çok adımlı akıl yürütme nedeniyle 2-10 kat daha fazla hesaplama süresi ve token gerektirdiğini ortaya koyuyor.
Enhanced ile Agentic RAG arasındaki seçim, kısıtlamalarınıza bağlı. Geliştirilmiş RAG, daha zayıf modellerde öngörülebilirlik, daha düşük maliyetler ve istikrar sağlar. Ajanik RAG esneklik sağlar ancak daha güçlü modeller ve daha fazla hesaplama gerektirir.
Makale:
Akademimizde etkili Ajanik RAG sistemleri kurmayı öğrenin:

105
Uzun ufuk görevleri için basit bir bellek çözümü.

DAIR.AI15 Oca 22:22
LLM Ajanlarında Otonom Bellek Yönetimi
LLM ajanları, bağlam şişkinliği nedeniyle uzun ufuk görevlerinde zorlanır.
Etkileşim geçmişi büyüdükçe, hesaplama maliyetleri patlar, gecikme artar ve akıl yürütme, alakasız geçmiş hatalarla dikkat dağıtmaktan zayıflar.
Standart yaklaşım sadece ekleme yöntemidir: her düşünce, araç çağrısı ve yanıt kalıcı olarak biriktirilir. Bu kısa görevler için işe yarar, ancak karmaşık keşiflerde başarısızlığı garanti eder.
Bu araştırma, sümük küfünden (Physarum polycephalum) esinlenen ajan merkezli bir mimari olan Focus'u tanıtıyor. Biyolojik içgörü: organizmalar labirentteki her hareketin mükemmel kaydını tutmaz. Öğrenilen haritayı korurlar.
Focus, ajanlara iki yeni ilkel varlık verir: start_focus ve complete_focus. Ajan, öğrenimleri ne zaman kalıcı bir Bilgi bloğunda birleştireceğine otonom bir şekilde karar verir ve ham etkileşim geçmişini aktif olarak busar. Sıkıştırmayı zorlayan harici zamanlayıcılar veya sezgisel sistemler yok.
Araştırdığınız şeyi açıklar, standart araçlarla araştırır ve ardından denenenleri, öğrenilenler ve sonucu özetleyerek birleştirir. Sistem bunu kalıcı bir Bilgi bloğuna ekler ve kontrol noktası ile mevcut adım arasındaki her şeyi siler.
Bu, monoton şekilde artan bağlamı testere dişi desenine dönüştürür: keşif sırasında büyüme, konsolidasyon sırasında çöküş.
Claude Haiku 4.5 ile yapılan SWE-bench Lite değerlendirmesi, Focus'un %22,7 token azalması (14,9 milyondan 11,5 milyon tokena kadar) ve aynı doğruluğu (hem temel hem de Focus için %60) koruduğunu gösteriyor. Bireysel durumlarda %57'ye kadar tasarruf görüldü.
Agresif teşvik önemlidir. Pasif yönlendirme sadece %6 tasarruf sağlıyordu. Her 10-15 araç çağrısında sıkıştırma için açık talimatlar ve sistem hatırlatmaları, sıkıştırmaları görev başına 2.0'dan 6.0'a çıkardı.
Yetenekli modeller, uygun araçlar ve yönlendirme verildiğinde bağlamlarını otonom olarak kendi kendine düzenleyebilir; bu da görev performansından ödün vermeden maliyet duyarlı ajanik sistemler için yollar açar.
Makale:
Akademimizde etkili yapay zeka ajanları oluşturmayı öğrenin:

17
En İyiler
Sıralama
Takip Listesi
