OpenAI 通过 gpt-5 codex 解决了 "确保你的代码确实运行" 的奖励,这一点得到了体现。