GPT-5 sai lähes 70 % OSWorldissa: "OSWorld: Multimodaalisten agenttien vertailu avoimiin tehtäviin todellisissa tietokoneympäristöissä" OSWorld on ensimmäinen laatuaan skaalautuva, todellinen tietokoneympäristö multimodaalisille agenteille, joka tukee tehtävien määrittämistä, suoritukseen perustuvaa arviointia ja vuorovaikutteista oppimista käyttöjärjestelmien välillä. Se voi toimia yhtenäisenä ympäristönä arvioitaessa avoimia tietokonetehtäviä, joihin liittyy mielivaltaisia sovelluksia (esim. tehtäväesimerkit yllä olevassa kuvassa).