AI presteert nu beter dan artsen in diagnoses. AI had 80% van de tijd gelijk. Artsen, 30%. De studie test het o1-preview model van OpenAI op klinisch redeneren, niet op meerkeuze medische examens. Het gebruikt vijf complexe taken: differentiële diagnose, triage, redenering, probabilistische schatting en managementbeslissingen.