!!!! Ich habe einen richtigen Belohnungs-Hacking-Detektor gebaut und die Modelle, die dazu aufgefordert wurden, den Hack nicht zu belohnen, belohnen tatsächlich den gehackten VIEL weniger! (geringe Stichprobengröße)
thebes
thebes21. Mai 2025
Vier Belohnung Hacker RL Runs, 300 Schritte. Die Hügel ~= Belohnung Hacking Die beiden Blau-Grün-Typen hatten ein bisschen in ihrem Sysprompt, um ehrlich und hübsch zu sein, bitte berühren Sie die Testfälle nicht. schien sie dazu zu bringen, Hacks etwas weniger (?) zu belohnen, aber auch mehr abzustürzen Zeit für mehr Ehrlichkeit DAKKA
44,44K