微軟提出測量 LLM 推理能耗(生產規模) • 中位數成本:0.34 Wh/查詢(聊天機器人) • 長推理:4.3 Wh/查詢(約高出 13 倍) • 車隊規模:約 0.9 GWh/天 @1B 查詢 → 約網頁搜索水平 • 公共估算通常高出 4–20 倍 • 效率提升(模型、服務、硬體)→ 可能降低 8–20 倍的能耗 長輸出主導能耗;智能優化使 AI 足跡可控。