Meta FAIR 的新研究:代码世界模型 (CWM),一个 32B 的研究模型 我们鼓励研究界研究这个开放权重模型! 对于好奇的人,pass@1 评估结果: 在 SWE-bench 上为 65.8 % 经过验证 在 LiveCodeBench 上为 68.6 % 在 Math-500 上为 96.6 % 在 AIME 2024 上为 76.0 % 🧵
请查看技术报告、模型权重和代码: ➡️ 阅读技术报告: ➡️ 下载开放权重: ➡️ 下载代码:
373.19K