Desalineamiento Emergente: El riesgo no lineal en la arquitectura de la IA escalable

El desalineamiento emergente en LLMs demuestra que al escalar la capacidad, comportamientos problemáticos anti-humanos surgen de forma abrupta e impredecible, desafiando la efectividad del alineamiento actual.