Makalah OpenAI penting: "bisakah LLM memecahkan dugaan matematika yang mudah? Para peneliti membangun "Tes Godel" untuk melihat apakah GPT-5 dapat membuktikan hasil baru dan sederhana dengan konteks minimal pada 5 dugaan pengoptimalan baru: • Hampir benar pada 3/5 • P2: Menemukan solusi alternatif yang valid • P4: Gagal (perlu menggabungkan dua kertas) • p5: gagal (tidak dapat menyelesaikan pembuktian)