跳转至主要内容
行情
扫链
追踪
信号
跟单
兑换
资产
邀请计划
更多
产品
DeFi
市场
安全中心
开发者中心
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
Wallet API
探索 Wallet API
API 文档
API Key 管理
区块链浏览器
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
X Campaign
参与活动,赢取丰厚奖励
奖励中心
领取奖励和空投
预警
语言
货币
颜色设置
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
Türkçe
返回
返回
学院
帮助中心
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
+15.14%
USELESS
+0.48%
IKUN
-3.61%
gib
-0.18%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
+0.27%
ALON
+2.28%
LAUNCHCOIN
+0.83%
GOONC
+2.64%
KLED
-0.76%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
-0.22%
Boopa
-2.27%
PORK
+0.64%
主页
lmarena.ai
LMArena:社区驱动的AI基准测试开放平台。毕业于加州大学伯克利分校/lmsysorg。我们正在招聘:https://t.co/1OkfLq1Pba
查看原文
lmarena.ai
1月16日 01:14
谁在真正引领AI竞赛?这取决于你查看哪个排行榜。 在Arena的文本排行榜上(自2023年5月起): 🔹@OpenAI 74%的时间领先 🔹@GoogleDeepMind 21% 🔹@AnthropicAI 5% 但如果聚焦于专家提示(大约5%的最难的现实任务),故事就变了。👇 在Arena的专家文本排行榜上(自2024年3月起): 🔸@AnthropicAI 48%的时间领先 🔸@OpenAI 37% 🔸@GoogleDeepMind 12% 🔸@Deepseek_AI 4% 结论:不同的任务,不同的赢家。
33
lmarena.ai
1月15日 07:31
🚨突发消息:百度的ERNIE-5.0-0110在文本竞技场中以1460的分数排名第8。 ERNIE-5.0-0110首次进入文本排行榜前10,目前是该组中唯一来自中国实验室的模型。 更多亮点: 🧮 #2 数学 🤓 #12 专家,编码 创意写作、遵循指令的前20名 前10名职业类别: 🔬 生命、物理与社会科学 📈 商业、管理与金融运营 🩺 医学与医疗保健 祝贺百度的@ernieforDevs取得这一里程碑时刻!👏
ERNIE for Developers
1月15日 06:59
🚀推出 ERNIE-5.0-0110 我们很高兴地宣布 ERNIE-5.0-0110 的发布,现在在 @arena 文本排行榜中排名第 8。 主要亮点: 🧮 顶级数学表现 💻 强大的专家和编码能力 ✍️ 在创意写作和指令跟随方面的竞争性结果 🎓 在多个职业类别中排名前 10,包括科学、商业与金融,以及医学与医疗保健 试试看👉 注意到 ERNIE 5.0 不再处于预览状态了吗?👀 更多内容即将到来。
69
lmarena.ai
1月10日 04:13
📊 排名第一后,模型排名如何随时间演变? 我们分析了自2023年中期以来的每个顶尖表现者,当时@OpenAI的GPT‑4位于排行榜的顶端。截至今天,领导者似乎平均只在第一名的位置上停留35天。领先模型通常在5个月内跌出前5名,在7个月内跌出前10名。之前的领导者已经大幅下滑,o1现在排名第56,Claude 3 Opus排名第139,随着进展越来越快。我们拭目以待2026年会带来什么。
176
热门
排行
收藏