
En una era donde los modelos de lenguaje avanzados escriben código, resumen libros y simulan conversaciones humanas con una precisión escalofriante, la gran pregunta sigue sin resolverse: ¿cómo diablos lo hacen?
Anthropic, la startup creadora de Claude, ha dado un paso importante hacia una posible respuesta. Su nuevo proyecto de código abierto permite algo que hasta hace poco parecía imposible: trazar los pensamientos de una IA.
De la magia a los circuitos
La herramienta, bautizada como Open Source Circuit Tracing, expone cómo un modelo como Claude activa internamente miles de “neuronas” artificiales para llegar a una conclusión. Visualiza estos procesos con lo que llaman “gráficos de atribución”. Cada palabra generada, cada razonamiento aparente, se puede rastrear hacia las conexiones internas que lo produjeron.
Es el equivalente a ver no solo el resultado del pensamiento de una IA, sino el camino neuronal que la llevó allí.
Neuronpedia: el atlas de la mente sintética
El proyecto incluye una interfaz interactiva llamada Neuronpedia. Una especie de Wikipedia para neuronas artificiales, donde se puede navegar, anotar y compartir cómo ciertas unidades responden a ideas complejas: desde el sarcasmo hasta la lógica condicional, desde el multilingüismo hasta la planificación futura.
Más que una herramienta, es un acto político: romper el mito de la caja negra.
Interpretabilidad vs transparencia
No es magia negra, pero tampoco es oráculo. Anthropic reconoce que esta herramienta solo captura una parte del proceso real. El modelo sigue siendo una máquina de billones de parámetros, con capas y capas de comportamiento emergente. Pero esta apertura, aunque parcial, marca un punto de inflexión en la relación entre humanos y máquinas opacas.
¿Y ahora qué?
Esta iniciativa no solo busca comprensión técnica. También responde a la creciente demanda social de auditorías, seguridad y ética en sistemas generativos. Si una IA va a tomar decisiones que afectan vidas humanas, como mínimo debe explicarse. Aunque sea de forma visual.
Anthropic ha abierto una puerta. Lo que veamos al otro lado depende de cómo decidamos mirar.