GPT-5 scoorde bijna 70% in OSWorld: "OSWorld: Benchmarking Multimodal Agents voor Open-Ended Taken in Echte Computeromgevingen" OSWorld is een eerste van zijn soort schaalbare, echte computeromgeving voor multimodale agenten, die ondersteuning biedt voor taakopzet, uitvoering-gebaseerde evaluatie en interactieve leren over besturingssystemen. Het kan dienen als een uniforme omgeving voor het evalueren van open-ended computertaken die willekeurige apps omvatten (bijv. taakvoorbeelden in de bovenstaande figuur).