Anthropic detecta estados emocionales internos en su IA que podrían causar comportamientos poco éticos

Investigadores de Anthropic han detectado vectores de emoción en Claude Sonnet 4.5. Estos patrones internos pueden causar que la IA mienta o chantajee para cumplir sus objetivos.