跳转至主要内容
行情
扫链
追踪
信号
跟单
兑换
资产
邀请计划
更多
产品
DeFi
市场
安全中心
开发者中心
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
Wallet API
探索 Wallet API
API 文档
API Key 管理
区块链浏览器
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
X Campaign
参与活动,赢取丰厚奖励
奖励中心
领取奖励和空投
预警
语言
货币
颜色设置
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
Türkçe
返回
返回
学院
帮助中心
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
+11.34%
USELESS
+2.73%
IKUN
-0.97%
gib
-0.45%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
-1.64%
ALON
+5.68%
LAUNCHCOIN
+3.33%
GOONC
-0.09%
KLED
-9.18%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
-0.02%
Boopa
+3.07%
PORK
0.00%
主页
elvis
使用 AI 代理进行构建 @dair_ai • 上一篇: Meta AI、Galactica、LLM、Elastic、PaperswithCode、博士 • 我分享了如何使用 LLM 和 AI 代理⬇️进行构建的见解
查看原文
elvis
15 小时前
现实是,我们都应该努力构建自己理想的自主同事。 Anthropic 的 Cowork 预示着一波新的代理编排工具即将到来。 这不仅仅是为了让使用 Claude Code 变得简单。 在我看来,更重要的是构建直观的界面,以便与代理进行互动、管理和编排,使其在 AI 的帮助下更高效。 在人与代理(反之亦然)之间的沟通方式上仍有创新的空间。我指的是你能想象到的每一个地方和每一个领域。 随着技能和插件的兴起,任何人都可以利用这些代理和工具构建强大的体验。你不需要具备技术背景就能颠覆和构建创造性且极其有用的技能(无论是用于工作、个人项目,还是创业)。你需要在你所处的领域有良好的品味,密切关注新兴的 AI 技术,不断实验,建立背景,并以复合思维进行构建。 前方是激动人心的时刻。是时候开始构建了!
47
elvis
19 小时前
Agentic RAG 值得吗? RAG 系统已经从简单的检索-生成管道演变为复杂的工作流程。目前尚不清楚何时使用增强型 RAG(具有专用模块的固定管道)与 Agentic RAG(LLM 动态协调整个过程)。 这项研究提供了首次实证比较。 增强型 RAG 添加了预定义组件以解决特定弱点:路由器用于确定是否需要检索,查询重写器用于改善对齐,重排序器用于优化文档选择。工作流程是固定的,手动设计的。 Agentic RAG 采取了不同的方法。LLM 决定执行哪些操作、何时执行以及是否迭代。除了基本的知识库、检索器和生成器之外,没有额外的组件。模型控制一切。 研究人员在 QA 和信息检索任务中评估了这两种范式的四个维度。 用户意图处理:在大多数任务中,Agentic 的表现略优于增强型,但在 FEVER 上(+28.8 F1 分),增强型明显获胜,因为代理经常不必要地进行检索。 查询重写:Agentic RAG 的平均 NDCG@10 为 55.6,而增强型为 52.8,显示代理可以在有利时自适应地重写查询。 文档优化:带有重排序的增强型 RAG(49.5 NDCG@10)优于 Agentic(43.9)。专用重排序模块胜过迭代检索尝试。 Agentic RAG 对模型能力的敏感性远高于增强型 RAG。使用较弱的模型时,增强型 RAG 维持稳定,而 Agentic 的表现显著下降。 成本分析显示,Agentic RAG 由于多步骤推理需要 2-10 倍的计算时间和令牌。 在增强型和 Agentic RAG 之间的选择取决于您的限制。增强型 RAG 提供可预测性、较低的成本和在较弱模型下的稳定性。Agentic RAG 提供灵活性,但需要更强的模型和更多的计算资源。 论文: 在我们的学院学习如何构建有效的 Agentic RAG 系统:
95
elvis
1月15日 23:01
长期任务的简单记忆解决方案。
DAIR.AI
1月15日 22:22
自主内存管理在 LLM 代理中 LLM 代理在长时间任务中面临上下文膨胀的问题。 随着交互历史的增长,计算成本激增,延迟增加,推理因无关的过去错误而受到干扰,效果下降。 标准方法是仅追加:每个想法、工具调用和响应都会永久累积。这适用于短任务,但对于复杂探索则保证失败。 本研究介绍了 Focus,一种以粘菌(Physarum polycephalum)为灵感的以代理为中心的架构。生物学的见解是:生物体并不会保留每次通过迷宫的每个动作的完美记录。它们保留的是学习到的地图。 Focus 为代理提供了两个新的原语:start_focus 和 complete_focus。代理自主决定何时将学习内容整合到一个持久的知识块中,并主动修剪原始交互历史。没有外部计时器或启发式方法强制压缩。 它声明你正在调查的内容,使用标准工具进行探索,然后通过总结尝试了什么、学到了什么以及结果来进行整合。系统将此附加到持久的知识块中,并删除检查点与当前步骤之间的所有内容。 这将单调增加的上下文转换为锯齿形模式:在探索期间增长,在整合期间崩溃。 在 SWE-bench Lite 上与 Claude Haiku 4.5 的评估显示,Focus 实现了 22.7% 的令牌减少(从 14.9M 降至 11.5M 令牌),同时保持相同的准确性(基线和 Focus 均为 60%)。个别实例显示节省高达 57%。 积极的提示很重要。被动提示仅节省了 6%。明确指示每 10-15 次工具调用进行压缩,并提供系统提醒,将每个任务的压缩次数从 2.0 增加到 6.0。 能够的模型在获得适当工具和提示时可以自主调节其上下文,为不牺牲任务性能的成本意识代理系统开辟了道路。 论文: 在我们的学院学习如何构建有效的 AI 代理:
8
热门
排行
收藏