热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
关于 Kimi K2 的一些笔记 - 我刚花了几个小时,这样你就不用了。这其中有些是推测,但在提示领域有什么不是呢?所以:
- 令人难以置信的模型。
- 但在代理提示时可能非常困难。
- 我的假设是,在复杂场景中,MoE 架构有时会将请求路由到那些在工具使用方面表现糟糕的专家,这在 "它确实刚刚有效" 的情况下是极其令人沮丧的。
- 如果你的提示恰好激活了创意写作专家,这一点尤其如此!
- 单个词在这个模型中产生的影响要*大得多*,因为它们可以决定路由到哪些专家。
--> 在我的案例中,将特定的 MUST-RUN-TOOLs 包裹在 <TOOLS_TO_RUN> 标签中似乎强制路由到能够使用工具的专家。仅限于我的案例,但必须是这个确切的标签。
热门
排行
收藏