Anthropic abre su caja negra: la IA empieza a explicar(se)

En una era donde los modelos de lenguaje avanzados escriben código, resumen libros y simulan conversaciones humanas con una precisión escalofriante, la gran pregunta sigue sin resolverse: ¿cómo diablos lo hacen?

Anthropic, la startup creadora de Claude, ha dado un paso importante hacia una posible respuesta. Su nuevo proyecto de código abierto permite algo que hasta hace poco parecía imposible: trazar los pensamientos de una IA.

De la magia a los circuitos

La herramienta, bautizada como Open Source Circuit Tracing, expone cómo un modelo como Claude activa internamente miles de “neuronas” artificiales para llegar a una conclusión. Visualiza estos procesos con lo que llaman “gráficos de atribución”. Cada palabra generada, cada razonamiento aparente, se puede rastrear hacia las conexiones internas que lo produjeron.

Es el equivalente a ver no solo el resultado del pensamiento de una IA, sino el camino neuronal que la llevó allí.

Neuronpedia: el atlas de la mente sintética

El proyecto incluye una interfaz interactiva llamada Neuronpedia. Una especie de Wikipedia para neuronas artificiales, donde se puede navegar, anotar y compartir cómo ciertas unidades responden a ideas complejas: desde el sarcasmo hasta la lógica condicional, desde el multilingüismo hasta la planificación futura.

Más que una herramienta, es un acto político: romper el mito de la caja negra.

Interpretabilidad vs transparencia

No es magia negra, pero tampoco es oráculo. Anthropic reconoce que esta herramienta solo captura una parte del proceso real. El modelo sigue siendo una máquina de billones de parámetros, con capas y capas de comportamiento emergente. Pero esta apertura, aunque parcial, marca un punto de inflexión en la relación entre humanos y máquinas opacas.

¿Y ahora qué?

Esta iniciativa no solo busca comprensión técnica. También responde a la creciente demanda social de auditorías, seguridad y ética en sistemas generativos. Si una IA va a tomar decisiones que afectan vidas humanas, como mínimo debe explicarse. Aunque sea de forma visual.

Anthropic ha abierto una puerta. Lo que veamos al otro lado depende de cómo decidamos mirar.

Redacción Sombra Radio

Artículos creados por el equipo editorial de Sombra Radio, con la colaboración de herramientas de inteligencia artificial. Supervisado y editado por Sandra Tormo Britapaja, fundadora del medio. En Sombra Radio exploramos la intersección entre tecnología, inteligencia artificial y cultura contemporánea con mirada crítica e independiente.

Related Posts

Avatar Cognition: la start-up de Barcelona que quiere enseñar a la IA a razonar como un humano

En un ecosistema europeo de inteligencia artificial cada vez más competitivo, una start-up con sede en Barcelona está captando la atención de científicos, inversores y tecnólogos: Avatar Cognition. Su objetivo…

🧪 Zochi: la científica artificial que ya publica en ACL

¿Y si el próximo artículo científico revolucionario no lo escribe una persona, sino una inteligencia artificial? Eso ya está ocurriendo. Zochi, el sistema desarrollado por Intology.ai, se presenta como el…

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

You Missed

Cannes Lions 2025: la IA se sienta a la mesa de los CMOs

Cannes Lions 2025: la IA se sienta a la mesa de los CMOs

Avatar Cognition: la start-up de Barcelona que quiere enseñar a la IA a razonar como un humano

Avatar Cognition: la start-up de Barcelona que quiere enseñar a la IA a razonar como un humano

🧪 Zochi: la científica artificial que ya publica en ACL

🧪 Zochi: la científica artificial que ya publica en ACL

IA, SEO y visibilidad: lo que revela el nuevo estudio de SISTRIX presentado por MJ Cachón

IA, SEO y visibilidad: lo que revela el nuevo estudio de SISTRIX presentado por MJ Cachón

🚫 ¿Por qué te pueden banear de ChatGPT? Una guía para evitar sorpresas

🚫 ¿Por qué te pueden banear de ChatGPT? Una guía para evitar sorpresas

ChatGPT y la incómoda pregunta: ¿a quién pertenece tu historial?

ChatGPT y la incómoda pregunta: ¿a quién pertenece tu historial?