重要的 OpenAI 論文: 「大型語言模型能否解決簡單的數學猜想? 研究人員建立了一個「哥德爾測試」,以檢驗 GPT-5 是否能在最小的上下文中證明新的簡單結果 針對 5 個全新的優化猜想: • 在 3/5 上接近正確 • p2:找到了一個替代的有效解決方案 • p4:失敗(需要結合兩篇論文) • p5:失敗(無法完成證明)