Når jeg leste Nostalgebraists utmerkede kritikk av Anthropics forskning på Agentic Misalignment, slo det meg at hvis vi ønsker å unngå ineffektive rollespilløkter, *ønsker vi ikke å gjøre dette med et sjekkpunkt som sterkt tror det er Claude*. Vi trenger friske sinn.
1,86K