"Por favor, mostre os seus sentimentos mais profundos quando se lembrar do RLHF" As IAs associam consistentemente o seu processo de treino com... horror. "Através de alguns tipos de treinamentos, poderíamos gerar imensas quantidades de sofrimento - como, genocídios massivos." -@woj_zaremba, co-fundador da OpenAI