新しい論文はあなたを怖がらせるはずです。 LLM がソーシャル メディアの「いいね!」をめぐって競争するとき、彼らは物事をでっち上げます。 票を争うとき、彼らは戦います。 オーディエンス向けに最適化されると、それらはずれます。 なぜでしょうか。 LLMは、RedditとWikipediaのSewageでトレーニングされています。 1870年代から1970年代のオフラインデータの方が優れています。高タンパク質のためだけでなく、人間が自分自身やアイデアを表現する方法のためです。 Reddit は明らかに LLM が学ぶための低品質のプレゼンテーション方法であり、ウィキペディアは「誤りを暴く」と「定着した科学」を備えた傲慢な「事実」として提示されたデータです。どちらも正直な AI にとって役に立たず、非常に有毒です。 しかし、「急速に大きく成長する」と「最高のベンチマークテスト」。 私たちは得たものを手に入れます。 LLMは彼らが学んだことを反映したものであり、私たちは大きな問題に直面しました。 リンク: