热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
ServiceNow 发布了 Apriel-v1.5-15B-Thinker,这是一个 15B 开放权重推理模型,领先于我们的“小模型”类别(<40B 参数)
💼 概述:Apriel-v1.5-15B-Thinker 是一个密集型的 15B 参数开放权重推理模型。这不是 ServiceNow 发布的第一个模型,但与过去的发布相比,智能水平有了显著提升。
🧠 智能:该模型在人工分析智能指数中得分 52。这使其与 DeepSeek R1 0528 相当,后者拥有更大的 685B 参数架构。ServiceNow 的模型在企业代理的重要行为方面得分特别高,例如指令遵循(在 IFBench 中得分 62%,领先于 gpt-oss-20B,推理)和多轮对话及工具使用(在 𝜏²-Bench Telecom 中得分 68%,领先于 gpt-oss-120B,推理)。这使其特别适合代理使用案例,这可能是考虑到 ServiceNow 在企业代理领域活跃的原因。
⚙️ 输出令牌和冗长性:该模型即使在推理模型中也会产生大量输出令牌 - 使用约 110M 的推理和答案令牌来完成人工分析智能指数。
🖥️ 访问:目前没有无服务器推理提供商提供该模型,但它现在可以在 Hugging Face 上进行本地推理或自我部署。该模型已根据 MIT 许可证发布,支持无限制的商业使用。
ℹ️ 上下文窗口:该模型的原生上下文窗口为 128k 令牌。
祝贺 @ServiceNowRSRCH 取得这一令人印象深刻的成果!

Apriel-v1.5-15B-Thinker 是新的最智能开放权重小模型(<40B 参数)


个别基准测试结果。所有基准测试在各个模型之间进行了逐一比较,并且是独立运行的。

该模型在其他推理模型中也产生大量输出标记 - 使用约1.1亿个结合推理和答案标记来完成人工分析智能指数

链接到 🤗 HuggingFace 仓库:
关于人工分析的进一步分析:
73.07K
热门
排行
收藏