Nový článek by vás měl vyděsit. Když LLM soutěží o lajky na sociálních sítích, vymýšlejí si věci. Když soutěží o hlasy, bojují. Při optimalizaci pro cílové skupiny se tyto segmenty zarovnají. Proč? LLM jsou vyškoleni na kanalizaci Reddit a Wikipedia. Off-line data ze 70. až 70. let 19. století jsou lepší. Nejen kvůli vysokému obsahu bílkovin, ale kvůli způsobu, jakým lidé prezentovali sami sebe a své myšlenky. Reddit je zjevně nekvalitní způsob prezentace pro LLM a Wikipedie jsou data prezentovaná jako arogantní "fakta" s "vyvracením" a "ustálenou vědou". Obojí je pro poctivou umělou inteligenci zbytečné a vysoce toxické. Ale "rychle rosteme" a "nejlépe testujeme benchmark". Dostaneme to, co dostaneme. LLM jsou odrazem toho, co se naučí, a máme obrovský problém. Propojit: