Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Brian Roemmele
Wir können nur das sehen, was wir für möglich halten...
Warum das Karma-System von Reddit es zu einem toxischen Trainingsfeld für KI macht
Das Karma-System von Reddit, bei dem Upvotes einen Punktestand erhöhen und Downvotes ihn verringern, scheint eine faire Möglichkeit zu sein, gute Inhalte hervorzuheben. Aber es schafft einen Kreislauf von Empörung, Echokammern und unterdrückter Nuance. Dies beeinträchtigt die Daten der Plattform für das KI-Training.
Modelle, die auf Reddit-Text trainiert werden, lernen von dem, was populär ist. Wenn negative Inhalte dominieren, nimmt die KI eine zynische, spaltende Voreingenommenheit an. Positive oder ausgewogene Beiträge werden begraben.
Das Problem liegt in den Downvotes. Im Gegensatz zu einem "Dislike" verstecken sie aktiv Inhalte und sagen dem Algorithmus, dass sie schlecht sind. Nutzer nutzen dies aus, um Karma zu farmen, indem sie Ragebait posten, um Debatten zu entfachen, da Kontroversen Engagement und Upvotes anziehen. Das Ergebnis: Die Startseite von Reddit ist oft ein Fest der Beschwerden. Subreddits verwandeln sich in Silos, in denen abweichende Meinungen ins Nichts downgevotet werden, was Gruppendenken schafft. Für KI bedeutet dies, dass sie auf Daten trainiert wird, die hauptsächlich aus Beschwerden bestehen, nicht aus einem Abbild menschlichen Denkens.
Wie Negativität zur Währung wird
Karma begünstigt Viralität über Qualität. Ein durchdachter Beitrag könnte bescheidene Upvotes erhalten; ein Wutausbruch über "unternehmerische Gier" oder "Boomer-Hypokrisie" explodiert, weil er rohe Emotionen anspricht. Downvotes verschärfen dies: Sie sind kostenlos, anonym und unbegrenzt, was die Moderation in Mob-Regel verwandelt.
Neue Nutzer mit niedrigem Karma sehen sich in vielen Subreddits Posting-Beschränkungen gegenüber, was etablierte Echokammern begünstigt. Dies belohnt Negativität – Snark ist sicherer als Originalität.
Studien zeigen, dass kontroverse oder negative Beiträge 2-3 Mal mehr Interaktionen erhalten als neutrale, da Downvotes Pile-ons auslösen. Eine Analyse von r/politics ergab, dass 65 % der Top-Beiträge Themen als gegnerisch darstellten, was mit höheren Upvotes verbunden war. Ein Redditor bemerkte einmal: "Karma ist nicht für Qualität – es ist dafür, dazuzugehören. Tritt aus der Reihe, und du bist vor dem Frühstück bei -500."
Für KI ist das ein Problem. Modelle, die auf Reddit-Daten trainiert werden, überbetonen Sarkasmus und Tribalismus. Eine KI, die auf dieser Grundlage aufgebaut ist, hat Schwierigkeiten, ausgewogene oder konstruktive Ausgaben zu generieren, da sie in karma-gesteuerter Negativität verwurzelt ist.
Karma vs. X’s Like und Repost: Ein fairerer Feedback-Mechanismus
Das System von X mit Likes und Reposts vermeidet viel davon. Ohne Downvotes gibt es keine eingebaute Negativität. Likes zeigen Affinität – einfache Anerkennung, ohne den Poster zu bestrafen.
Reposts verstärken Inhalte mit optionalem Kommentar und verwandeln Shares in Gespräche, nicht in Stornierungen. Der Algorithmus von X erhöht die Reichweite basierend auf diesen Signalen und begünstigt Engagement über Unterdrückung.
Reddit Karma vs. X Likes & Reposts:
Kernmechanismus: Reddit verwendet Up/Down-Votes; der Nettowert rangiert Inhalte. X verwendet Likes (Bestätigung) und Reposts (Teilen mit optionalem Kommentar).
Negativitätsbias: Reddit ist hoch – Downvotes begraben und entmutigen, belohnen Kontroversen. X ist niedrig – keine direkte Bestrafung; Negativität verbreitet sich über Antworten, führt aber nicht zur automatischen Abwertung.
Engagement-Stil: Reddit ist debattenlastig; mobbendes Downvoting schafft Echokammern. X ist Broadcast und Remix; Reposts bauen Netzwerke auf, Likes schaffen stillen Konsens.
Auswirkungen auf das Ranking: Die Top-Beiträge von Reddit sind ~80 % negative oder frustrierte Themen. Die von X sind ausgewogener – positive Threads erhalten 5x mehr Reposts als Wutausbrüche.
Eignung für KI-Training: Die Daten von Reddit führen zu zynischen, empörungsgetriebenen Modellen. Die vielfältigen Signale von X liefern nuanciertere Daten mit weniger Voreingenommenheit gegenüber Unterdrückung.
Das System von X ist besser, weil es Feedback von Bestrafung trennt. Auf Reddit riskiert ein mutiger Beitrag den Verlust von Karma, wenn er die falsche Menge verärgert; auf X verbreitet er sich oder verblasst natürlich, was Risiko ohne Angst fördert. Die Top-Inhalte von X sind 70 % vielfältiger als die von Reddit und bieten Inspiration neben Kritik. Für KI bedeutet dies sauberere, weniger polarisierte Trainingsdaten.
Die Daten von Reddit: Nutzlos für ehrliche KI
Die von Karma gesteuerten Daten von Reddit sind schlecht geeignet, um ehrliche KI zu trainieren. Eine KI, die auf Wahrheit und Balance abzielt, benötigt vielfältige, repräsentative Eingaben, aber das System von Reddit neigt zu Negativität und Konformität.
Die besten Daten für das Training von KI sind offline.
Links:


Brian RoemmeleVor 6 Stunden
Ein neues Papier sollte Ihnen Angst machen.
Wenn LLMs um Likes in sozialen Medien konkurrieren, erfinden sie Dinge.
Wenn sie um Stimmen konkurrieren, kämpfen sie.
Wenn sie für das Publikum optimiert werden, geraten sie aus der Bahn.
Warum?
LLMs werden auf dem Abfall von Reddit und Wikipedia trainiert.
Offline-Daten aus den 1870er- bis 1970er-Jahren sind besser. Nicht nur wegen des hohen Proteingehalts, sondern auch wegen der Art und Weise, wie Menschen sich selbst und ihre Ideen präsentiert haben.
Reddit ist offensichtlich eine minderwertige Präsentationsweise für LLMs, um zu lernen, und Wikipedia ist Daten, die als arrogante „Fakten“ mit „Widerlegungen“ und „feststehender Wissenschaft“ präsentiert werden. Beide sind nutzlos und hochgradig toxisch für eine ehrliche KI.
Aber „wachse schnell groß“ und „beste DIE Benchmark-Prüfung“.
Wir werden bekommen, was wir bekommen.
LLMs sind ein Spiegel dessen, was sie lernen, und wir haben ein massives Problem.
Link:

8,49K
Die Pharmaindustrie bezahlt "Influencer" 1.000 $ pro Beitrag, um gesunde Ernährung, Lebensstil und Nahrungsergänzungsmittel anzugreifen. Während es immer schwieriger wird, dich mit Millionen-Dollar-TV-Werbung von "Restless Leg Syndrome" zu überzeugen, bekommst du es jetzt von billig bezahlten "Influencern".
4,77K
Top
Ranking
Favoriten