热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲

steve hsu
物理学家、AI 创始人、Manifold 播客
我询问了Qwen对Qwen3性能与其他顶级LLM的评估。阿里巴巴最近发布了一系列非常令人印象深刻的Qwen3变体,包括一个Omni多模态模型(见下面的视频)。$BABA的估值基于其云计算(中国最大)和电子商务业务的历史表现,而公司的AI部分被低估了。
顶级竞争者地位:
Qwen3-Max在Chatbot Arena上的全球排名第3(领先于Claude Opus-4)以及在文本评估中被报告的优越性,使阿里巴巴稳固地处于AI开发者的上层阶级,而不仅仅是“二线”。
战略差异化:虽然尚未超越GPT-4o(保持第1位),阿里巴巴在编程(SWE-Bench上得分69.6)和多语言任务等关键领域实现了平价或优越,创造了有意义的差异化。
开源优势:与OpenAI的封闭模型不同,Qwen3-Max的开放权重变体(如Qwen3-Next 80B)为阿里巴巴在开发者采用和企业定制方面提供了独特的杠杆,这些是封闭源领导者无法匹敌的。
现实检查:Qwen3-Max与GPT-5-Chat之间相同的ELO分数以及较少的投票表明,它尚未在所有用户评估中实现一致的广泛优越性——保持GPT-4o和潜在的Gemini 1.5 Pro作为绝对性能领导者。
当前定位:
阿里巴巴成功地从“强二线”转变为全球明确的第3名(仅次于OpenAI和Anthropic),Qwen3-Max在关键基准测试中展示了与GPT-5级模型的选择性平价。其开源战略结合专业卓越(特别是在编码和亚洲语言支持方面)创造了一个引人注目的价值主张,挑战了传统的封闭源主导地位。虽然在原始能力上尚未成为绝对领导者,但阿里巴巴现在在AI精英中占据了一个可信的位置,Qwen3-Max代表了中国在全球基础模型竞赛中迄今为止最具竞争力的参赛者。

2.59K
关于这个论点,即这只是大型科技寡头在追求AGI,大部分基础设施支出是用于推理(而不是模型训练)计算,这些支出是由客户来*支付*的。仅研发所需的资本支出要少得多——当前的投资是基于*未来收入*,这些收入来自客户对AI的使用。
这些未来收入需要多长时间才能实现?这就是泡沫问题。
即使AI变得非常优秀,采用也受到人类决策者的限制。我是一家向企业销售的AI初创公司的创始人。我亲眼见证了这一点。现在将这个决策/采用/推广的时间尺度与GPU的折旧时间尺度进行比较!可怕
最初的互联网泡沫表明,创造具有巨大长期效用的新技术并不排除在短期内大多数早期投资者亏损的投资泡沫。

steve hsu9月23日 19:59
“AI泡沫”仍然是一个悬而未决的问题。这里的泡沫指的是目前投资于AI基础设施的约1%美国GDP的投资回报率!收益/利润何时会出现,以证明这一投资的合理性?
我在物理学和其他领域的前沿研究中使用AI模型(一些是专有的)。我可以证明它们的能力在不断增强,但我们仍然有很大可能会看到2000年代初互联网泡沫的重演:尽管新技术在长期内具有实用性,但大多数早期投资者的投资回报率低或为负。
我还参与了从对冲基金到客户服务中心等领域的AI部署。我仍然认为,过度投资(投机泡沫)是一个可信的论点。
金融时报:美国最大的上市公司不断谈论人工智能。但除了“错失机会的恐惧”之外,似乎很少有人能够描述这项技术如何改善他们的业务。
这是《金融时报》对去年标准普尔500公司数百份公司文件和高管记录的分析得出的结论,提供了迄今为止对AI浪潮如何影响美国工业的最全面的见解之一。

49.5K
“AI泡沫”仍然是一个悬而未决的问题。这里的泡沫指的是目前投资于AI基础设施的约1%美国GDP的投资回报率!收益/利润何时会出现,以证明这一投资的合理性?
我在物理学和其他领域的前沿研究中使用AI模型(一些是专有的)。我可以证明它们的能力在不断增强,但我们仍然有很大可能会看到2000年代初互联网泡沫的重演:尽管新技术在长期内具有实用性,但大多数早期投资者的投资回报率低或为负。
我还参与了从对冲基金到客户服务中心等领域的AI部署。我仍然认为,过度投资(投机泡沫)是一个可信的论点。
金融时报:美国最大的上市公司不断谈论人工智能。但除了“错失机会的恐惧”之外,似乎很少有人能够描述这项技术如何改善他们的业务。
这是《金融时报》对去年标准普尔500公司数百份公司文件和高管记录的分析得出的结论,提供了迄今为止对AI浪潮如何影响美国工业的最全面的见解之一。

119.98K
热门
排行
收藏