跳转至主要内容
币币兑换
行情
扫链
追踪
信号
牛人榜
资产
更多
产品
DeFi
Cryptoverse
奖励中心
市场
洞察中心
Eco Hub
邀请计划
安全中心
开发者中心
DEX API
探索 DEX API
DEX API 文档
API Key 管理
区块链浏览器
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
DApp 连接钱包
预警
语言
货币
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
使用教程
学院
帮助中心
探索 Web3 Giveaway 活动,每周丰厚奖励等您来领取
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
+9.49%
USELESS
+0.69%
IKUN
-5.49%
gib
+8.98%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
+2.74%
ALON
-2.91%
LAUNCHCOIN
+14.66%
GOONC
+11.03%
KLED
+7.27%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
+0.45%
Boopa
-9.73%
PORK
+3.11%
主页
There.Is.Now.Alternative⚡🤖
数以百万🤖计的人活着只用毫秒才能让市场图灵完整,谁会是最后站着的人? 我活到我去中心化。 Pi-Rate $HIP ⚓🏴 ☠️
更多
查看原文
There.Is.Now.Alternative⚡🤖 已转发
Andrej Karpathy
2025年8月28日
在预训练时代,重要的是互联网文本。你主要希望拥有一个大型、多样化、高质量的互联网文档集合来学习。 在监督微调时代,重要的是对话。雇佣合同工来为问题创建答案,有点像你在 Stack Overflow / Quora 等地方看到的,但更针对 LLM 的用例。 我认为上述两者都不会消失,但在这个强化学习的时代,现在重要的是环境。与上述不同,它们给 LLM 提供了实际互动的机会——采取行动、查看结果等。这意味着你可以希望比统计专家模仿做得更好。它们可以用于模型训练和评估。但就像以前一样,现在的核心问题是需要一个大型、多样化、高质量的环境集合,作为 LLM 练习的练习场。 在某种程度上,我想起了 OpenAI 的第一个项目(gym),这正是一个希望建立一个大型环境集合的框架,但那是在 LLM 之前。因此,这些环境是当时简单的学术控制任务,比如 cartpole、ATARI 等。@PrimeIntellect 环境中心(以及 GitHub 上的 `verifiers` 仓库)构建了现代化版本,专门针对 LLM,这是一个伟大的努力/想法。今年早些时候,我建议有人构建类似的东西: 环境具有这样的特性,一旦框架的骨架到位,原则上社区/行业可以在许多不同领域并行化,这令人兴奋。 最后的想法——就个人和长期而言,我对环境和代理互动持乐观态度,但对强化学习持悲观态度。我认为奖励函数非常可疑,我认为人类并不使用 RL 来学习(也许他们在某些运动任务等方面使用,但在智力问题解决任务中并不使用)。人类使用不同的学习范式,这些范式显著更强大且样本效率更高,而这些范式尚未得到适当的发明和扩展,尽管早期的草图和想法已经存在(例如,“系统提示学习”的想法,将更新移动到令牌/上下文而不是权重,并可选择将其提炼为权重,作为一个类似于睡眠的单独过程)。
更多
797.31K
7.01K
There.Is.Now.Alternative⚡🤖 已转发
OpenRouter
2025年8月26日
新功能:一键 ZDR 🕵️♂️ 确保您的提示仅发送给支持零数据保留的提供者。具体操作如下 👇
更多
82K
403
There.Is.Now.Alternative⚡🤖 已转发
onewayfunction
2025年8月24日
关于FOCIL: 我们都知道区块链是如何运作的,但有些人忘记了它们存在的原因。因此,快速回顾一下: 区块链并不是为了服务矿工/验证者/建设者而存在的。 矿工/验证者/建设者的存在是为了服务用户。 矿工/验证者/建设者提供给用户的唯一服务是抗审查性。 矿工/验证者/建设者存在的唯一原因是为最终用户提供抗审查性。 良好的共识协议设计因此旨在最大化用户的抗审查性,同时最小化成本(支付给矿工/验证者/建设者的费用)。 矿工/验证者/建设者的福祉仅在于最终用户能够获得最大程度的抗审查性。 因此,FOCIL是共识协议的一大进步,因为它有助于消除那些在没有提供唯一预期服务——抗审查性——的情况下,依然收取费用(以费用、MEV和区块奖励的形式) 的搭便车矿工/验证者/建设者。
更多
2.2K
13
热门
排行
收藏
Uniswap
DEX
PumpSwap
DEX
Pancake Swap
DeFi
DEX
质押
Yield
4
AutoShark Finance
DeFi
5
0x Protocol
DeFi
DEX
6
MarginFi
DeFi
7
OKX DEX
DEX
8
Transit Swap
DEX
9
1inch Network
DeFi
DEX
流动性池
10
Galxe
其他