@Havelock_AI notların sağlamlığını bir turnuva düzenleyerek test etmek; burada Claude'a sadece iki metnin dilbilgisi ve sözcük işaretleri (içerik yok) sunulur ve hangisinin daha sözlü olduğunu tahmin etmesi istenir. Daha yüksek puanlı metinlerin gerçekten daha yüksek ELO puanları olup olmadığını göreceğiz.
Büyük koşudan önceki ilk test partisi
73