跳转至主要内容
行情
扫链
追踪
信号
牛人榜
兑换
资产
邀请计划
更多
产品
DeFi
市场
洞察中心
Eco Hub
安全中心
开发者中心
DEX API
探索 DEX API
DEX API 文档
API Key 管理
区块链浏览器
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
Giveaway
完成指定任务,领取空投好礼
交易赛
交易热门代币,冲榜赢大奖
奖励中心
领取奖励和空投
预警
语言
货币
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
使用教程
学院
帮助中心
探索 Web3 Giveaway 活动,每周丰厚奖励等您来领取
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
-5.2%
USELESS
-0.39%
IKUN
+5.23%
gib
-0.07%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
-1.41%
ALON
-4.03%
LAUNCHCOIN
-3.05%
GOONC
+4.85%
KLED
-1.74%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
-0.92%
Boopa
-0.31%
PORK
+4.33%
主页
Tim Dettmers
Tim Dettmers
9月20日 04:06
仔细观察,PyTorch 也使用 FP32,但这里是 bnb Adam 更好的真正原因:我们针对浮点数进行了优化,顺序很重要!计算 sqrt(v) + eps*c2 然后再除以 c2 可以避免放大错误,而不是 PyTorch 的 sqrt(v)/c2 + eps。相同的数学, 更好的稳定性!
Tim Dettmers
9月19日 21:50
听说来自团队 bitsandbytes 的 Adam 32 位在损失和稳定性方面比 PyTorch Adam 更好。我们所有的计算都是在 fp32 中进行的,因此你拥有的梯度并不重要;计算更为精确。这类似于 DeepSeek 在其 8 位矩阵乘法中的 fp32 累积。
835
Tim Dettmers
9月19日 21:50
听说来自团队 bitsandbytes 的 Adam 32 位在损失和稳定性方面比 PyTorch Adam 更好。我们所有的计算都是在 fp32 中进行的,因此你拥有的梯度并不重要;计算更为精确。这类似于 DeepSeek 在其 8 位矩阵乘法中的 fp32 累积。
109
Tim Dettmers
9月8日 19:57
感觉编码代理的前沿现在已经开放: GLM 4.5 每月仅需 3 美元,与 Sonnet 不相上下。 Kimi K2.1 Turbo 速度是 Opus 4.1 的 3 倍,价格便宜 7 倍,但效果一样好。 Kimi K2.1 感觉很干净。对我来说是最好的模型。GPT-5 只适合复杂的规格——太慢了。
1.13K
热门
排行
收藏