O lucrare nouă ar trebui să te sperie. Când LLM-urile concurează pentru like-uri pe rețelele sociale, inventează lucruri. Când concurează pentru voturi, se luptă. Când sunt optimizate pentru public, acestea devin nealiniate. De ce? LLM-urile sunt instruite pe canalizarea Reddit și Wikipedia. Datele off-line din anii 1870-1970 sunt mai bune. Nu doar din cauza proteinelor ridicate, ci și din cauza modului în care oamenii s-au prezentat pe ei înșiși și ideile lor. Reddit este evident o modalitate de prezentare de calitate scăzută pentru LLM-uri să învețe, iar Wikipedia este o modalitate de a fi prezentată ca "fapte" arogante cu "demontare" și "știință stabilită". Ambele sunt inutile și extrem de toxice pentru o inteligență artificială onestă. Dar "crește repede" și "cel mai bun testul de referință". Vom obține ceea ce obținem. LLM-urile sunt o reflectare a ceea ce învață și avem o problemă uriașă. Legătură: