Onderzoek
Anthropic vindt 171 emotievectoren in Claude Sonnet 4.5
Anthropic haalde 171 emotie-vectoren uit Claude Sonnet 4.5 met sparse autoencoders. Amira legt uit waarom die vondst de toekomst van AI-alignment verandert.
Lees meer →