Bài báo quan trọng của OpenAI: "Liệu LLM có thể giải quyết các giả thuyết toán học đơn giản không? Các nhà nghiên cứu đã xây dựng một "Bài kiểm tra Godel" để xem liệu GPT-5 có thể chứng minh các kết quả mới, đơn giản với bối cảnh tối thiểu hay không trên 5 giả thuyết tối ưu hóa mới: • gần đúng trên 3/5 • p2: tìm thấy một giải pháp thay thế, hợp lệ • p4: thất bại (cần kết hợp hai bài báo) • p5: thất bại (không thể hoàn thành chứng minh)