La generación de vídeo por inteligencia artificial da otro salto. Google ha comenzado el despliegue global de Veo 3, su modelo de texto a vídeo más avanzado hasta la fecha, con capacidad para generar clips realistas de hasta 8 segundos en calidad 4K… con audio incluido: efectos de sonido, música ambiental e incluso diálogos sintéticos.
Anunciado durante el Google I/O 2025, Veo 3 es la primera versión que incorpora sonido integrado generado por IA, algo que hasta ahora ninguna otra plataforma había ofrecido de forma estable. Y desde este julio, su llegada se extiende más allá de los mercados iniciales, sumando países como India, Indonesia, Arabia Saudí, México y varias regiones de África y Sudamérica.
📦 ¿Qué es exactamente Veo 3?
Veo 3 es un modelo generativo multimodal de Google capaz de crear vídeos cortos a partir de una entrada de texto, imagen o estilo. Lo más destacado:
- 🎬 Clips de hasta 8 segundos con resolución 720p o 4K.
- 🧠 Control de estilo, ritmo y narrativa mediante texto.
- 🎧 Audio generado automáticamente: efectos ambientales, voces y música.
- 🧩 Interfaz disponible en Google Gemini (Pro/Ultra) y en Vertex AI para empresas.
Esta generación incluye herramientas para crear storyboards, dirigir escenas o ajustar detalles de color, iluminación y tempo visual.
🌍 Despliegue global: más allá del mundo anglosajón
En su primera fase, Veo 3 se lanzó en EE. UU., Canadá, Australia y algunos países europeos fuera de la UE. Pero desde julio de 2025, Google ha comenzado su expansión mundial:
- 📱 Disponible a través de la app Gemini para suscriptores Pro o Ultra.
- 💼 En empresas vía Vertex AI para flujos de trabajo profesionales.
- 🌎 Activado ya en mercados clave como India, Emiratos, Sudeste Asiático, África, México y Brasil.
💡 En India, el precio mensual ronda los ₹1.950 (~21 €) bajo Gemini Pro, y ya es tendencia viral en redes por los vídeos que genera en segundos con comandos como “niños jugando bajo la lluvia” o “cena familiar futurista en Mumbai”.
🧠 ¿Qué lo diferencia de modelos anteriores?
A diferencia de versiones anteriores, Veo 3 genera sonido sincronizado al contenido. Esto implica:
- Voces IA sin necesidad de prompt específico.
- Paisajes con sonidos naturales (olas, lluvia, viento…).
- Vídeos con narrativa implícita sin necesidad de montaje externo.
- Dirección creativa de ritmo, color y emoción desde el prompt.
📌 En SombraRadio lo leemos así:
La llegada de Veo 3 a más países no es solo una actualización tecnológica. Es una ampliación radical del acceso a la creatividad por IA, especialmente en regiones donde producir contenido audiovisual era costoso o inaccesible.
Y lo que antes parecía magia, hoy cabe en una línea de texto.
El vídeo ya no se graba. Se genera.