اختبار متانة نتائج @Havelock_الذكاء الاصطناعي من خلال تنظيم بطولة، حيث يعرض على كلود فقط العلامات النحوية والمفردية (بدون محتوى) لنصين ويطلب منه تخمين أيهما أكثر شفهيا. سنرى إذا كانت النصوص ذات الدرجات الأعلى فعلا لديها تصنيفات أعلى في التصنيف.
أول دفعة اختبار قبل الجولة الكبيرة
‏‎72‏