Tencent libera HunyuanCustom: un modelo multimodal de código abierto que crea video personalizado con precisión quirúrgica

China responde con fuerza a la hegemonía occidental de los modelos generativos. Esta semana, Tencent ha hecho oficial el lanzamiento de HunyuanCustom, una plataforma de generación de video multimodal de código abierto, impulsada por un modelo de 13 mil millones de parámetros que promete una nueva era de producción audiovisual mediante IA.

HunyuanCustom no es solo una herramienta creativa. Es una infraestructura completa de generación de contenidos, capaz de procesar entradas en texto, imagen, audio y video para generar clips realistas con un nivel de coherencia entre sujetos que hasta ahora solo era posible con soluciones cerradas y privativas.

🧬 Un modelo, múltiples entradas: texto, voz, imagen y video

Lo que posiciona a HunyuanCustom como una pieza clave en la próxima fase de IA generativa no es solo su capacidad de generar video. Es su entrenamiento multimodal nativo y su arquitectura diseñada desde el inicio para entender y sintetizar inputs cruzados: texto descriptivo, imágenes de referencia, voces pregrabadas, incluso clips de video incompletos.

Esto significa que los usuarios pueden, por ejemplo:

  • Escribir un guion y cargar una imagen del protagonista → obtener un video animado del personaje actuando la escena.
  • Proporcionar una voz y un escenario → generar un diálogo actuado.
  • Usar dos imágenes diferentes como referencia → producir escenas coherentes con varios sujetos en continuidad.

Y todo ello manteniendo la consistencia visual, expresiva y narrativa, incluso cuando hay múltiples personas o personajes interactuando.

🎥 Generación de video con precisión de sujeto: el verdadero breakthrough

El gran hito de HunyuanCustom es su capacidad para generar videos con consistencia de sujeto a lo largo de múltiples escenas. No se trata de deepfakes, ni de animaciones rígidas. Estamos hablando de una IA que puede mantener la identidad visual, los gestos y los movimientos de uno o más personajes a través de cambios de entorno, perspectiva, tiempo y contexto.

Este avance es clave en un momento en el que las aplicaciones de IA generativa enfrentan críticas por su falta de control en resultados complejos. Tencent responde con un modelo que parece haber sido entrenado para la precisión, no solo para el impacto visual.

🧠 Open Source, pero con condiciones chinas

Aunque se presenta como open source, el acceso a HunyuanCustom viene con una salvedad: se distribuye bajo una licencia que permite uso comercial y de investigación, pero con un marco regulatorio vinculado al cumplimiento de las leyes chinas sobre contenido generado por IA.

Esto marca una diferencia significativa respecto a modelos como Sora de OpenAI (aún cerrado), Runway Gen-3 Alpha (bajo acceso limitado) o Pika (cerrado y con branding agresivo). Tencent ofrece una alternativa que abre el juego, pero marca las reglas desde Pekín.

⚖️ ¿Estamos frente al primer “modelo soberano” de video generativo?

Con HunyuanCustom, Tencent no solo lanza una tecnología. Lanza una declaración de independencia digital. Mientras Occidente debate sobre copyright, derechos de imagen y políticas de entrenamiento, China avanza con modelos robustos, controlados, pero distribuidos.

Este es el primer modelo de video generativo de alto nivel que:

  • Es multimodal completo (no solo texto a video).
  • Mantiene sujeto consistente en entornos dinámicos.
  • Es open source con orientación comercial.
  • Nace con respaldo de una de las Big Tech asiáticas.

🕶️ En la sombra… ya se graban nuevos mundos

Mientras tanto, en el otro lado de la pantalla, productores independientes, educadores, creativos y tecnólogos ya están probando las posibilidades de crear películas, campañas, explicaciones educativas o narrativas complejas usando tan solo texto y una idea.

La generación de video ya no será cuestión de cámaras, sino de prompts.
El talento no se medirá solo en técnica, sino en visión, narración y control sobre la IA.

Y en ese nuevo orden, HunyuanCustom puede ser el primer director de cine digital con pasaporte asiático y licencia libre.

Foto del avatar
Redacción Sombra Radio

Artículos creados por el equipo editorial de Sombra Radio, con la colaboración de herramientas de inteligencia artificial. Supervisado y editado por Sandra Tormo Britapaja, fundadora del medio. En Sombra Radio exploramos la intersección entre tecnología, inteligencia artificial y cultura contemporánea con mirada crítica e independiente.

Artículos: 441

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *