Тестирование надежности оценок @Havelock_AI путем проведения турнира, в котором Клод просто получает грамматические и лексические маркеры (без содержания) двух текстов и должен угадать, какой из них более устный. Посмотрим, действительно ли тексты с более высокими оценками имеют более высокие ELO.
Первый тестовый пакет перед большим запуском
100