Hechos
Información que Google ha publicado: disponibilidad, entradas, salidas, funciones, seguridad, marcas de agua y acceso previsto para API.
Investigación editorial para convertir una novedad técnica en una guía útil: qué es, qué puede hacer hoy, qué no conviene prometer todavía y cómo usarlo con método en imagen, vídeo y contenido multimodal.
Gemini Omni no debe explicarse como “otro generador de vídeo”. El punto fuerte es la mezcla de entrada multimodal, conocimiento del mundo, edición conversacional y continuidad entre revisiones. La guía debe enseñar a dirigirlo, no solo a escribir prompts bonitos.
La guía no debe perseguir titulares. Debe responder a una pregunta práctica: ¿cómo puede una persona usar Gemini Omni para crear o editar vídeo con más control, menos prueba-error y menos humo?
Información que Google ha publicado: disponibilidad, entradas, salidas, funciones, seguridad, marcas de agua y acceso previsto para API.
Qué significa para creadores: menos separación entre generar, editar y remezclar; más importancia del material de referencia y de las instrucciones por fases.
Cómo convertir la herramienta en flujo: preparar referencias, definir plano, pedir cambios concretos, iterar y verificar salida.
Omni está anunciado como modelo “any-to-any”, pero el despliegue inicial está centrado en vídeo. Esta distinción evita venderlo como una herramienta universal cerrada antes de tiempo.
| Área | Estado | Cómo lo trataría en la guía |
|---|---|---|
| Nombre público | Gemini Omni. Primer modelo: Gemini Omni Flash. | Usar “Gemini Omni” para la familia/concepto y “Omni Flash” para el modelo disponible. |
| Salida principal | Vídeo. Imagen y audio como salidas futuras, según comunicación de Google. | No prometer generación completa de cualquier formato hasta que esté disponible. |
| Entradas | Texto, imagen, vídeo y audio como referencias o material de partida. | Enseñar a combinar referencias, no solo a escribir texto. |
| Acceso | Gemini app, Google Flow y YouTube Shorts/Create. Acceso por planes Google AI según mercado y edad. | Explicar por dónde probarlo, pero avisar de variaciones por país, cuenta y plan. |
| API | Anunciada para desarrolladores y empresas en próximas semanas. | No crear tutorial técnico de API hasta que exista documentación estable. |
| Transparencia | Contenido con SynthID y C2PA Content Credentials en productos compatibles. | Incluir sección de verificación, trazabilidad y uso responsable. |
El salto no está en pedir “haz un vídeo bonito”. Está en usar materiales existentes —una foto, un clip, una voz, una acción, una estética— para construir una salida coherente.
La gente no necesita otro resumen de Google I/O. Necesita saber cuándo usar Omni, cómo prepararle material y cómo corregirlo sin perder el plano.
Idea editorial para Academia HLT.Probar ideas de vídeo sin rodaje completo, convertir fotos en clips, crear variaciones de una pieza y editar con lenguaje natural.
Visualizar campañas, generar prototipos, crear piezas sociales simples y testar conceptos antes de producirlos de verdad.
Crear ejemplos visuales, simulaciones, demostraciones y clips explicativos a partir de texto o materiales de referencia.
La guía final debería enseñar un sistema de dirección, no una lista infinita de trucos. Este sería el método base.
Antes de abrir Omni, escribe qué debe comunicar el vídeo: presentar, transformar, explicar, ambientar, vender, demostrar o remezclar.
Elige una foto o vídeo base con sujeto claro. Si añades referencias, separa función: una para identidad, otra para entorno, otra para estilo.
Indica producto, rostro, vestuario, encuadre, texto visible, proporción, colores de marca o cualquier elemento que deba mantenerse.
Omni trabaja mejor si la acción se puede ver: “la luz se apaga”, “el líquido cae”, “la cámara se acerca”, “el personaje gira”.
No cambies todo a la vez. Primero acción, luego cámara, luego atmósfera, luego detalles. Cada revisión debe tener una intención única.
Revisa manos, objetos, reflejos, sombras, sincronía con audio, texto visible, coherencia espacial y respeto al material original.
Prompts en español, pensados como plantillas. La clave es cambiar las variables entre corchetes y no pedir diez cosas incompatibles en una sola frase.
Usa la imagen de referencia como base principal.
Crea un vídeo corto de 10 segundos en formato [9:16 / 16:9 / 1:1].
Mantén reconocible [sujeto/producto/persona/objeto] y conserva [rasgos, colores, forma, logo, textura o identidad].
Acción principal: [describe una única acción visible].
Cámara: [plano, movimiento y velocidad].
Entorno: [lugar o atmósfera].
Luz: [tipo de iluminación].
Estilo visual: [realista, documental, editorial, cinematográfico, etc.].
No cambies: [elementos que deben mantenerse].
Evita: [deformaciones, texto inventado, objetos extra, cambios de identidad, estilo no deseado].
Sobre el vídeo anterior, cambia solo una cosa:
[describe el cambio concreto: fondo, luz, cámara, acción, objeto, vestuario, ritmo o estilo].
Mantén el mismo sujeto, la misma continuidad del movimiento y la composición general.
No rehagas el vídeo desde cero.
No alteres [elementos clave que deben permanecer].
Crea un vídeo corto para presentar [producto/marca/lugar].
Objetivo del vídeo: [presentar producto / generar deseo / explicar una característica / anunciar lanzamiento].
Público: [tipo de persona].
Formato: vertical 9:16 para redes sociales.
Duración: 10 segundos.
Debe sentirse [adjetivos concretos: cercano, premium, urbano, artesanal, técnico, cálido].
El producto debe verse claro desde el segundo [número].
Incluye movimiento de cámara [descripción].
Añade ambiente [sonido, textura, luz, entorno] solo si está disponible.
No uses estética genérica de anuncio de stock.
No inventes texto pequeño ilegible.
No cambies la forma real del producto.
Analiza este resultado como director visual.
Revisa:
1. Si el sujeto principal se mantiene reconocible.
2. Si la acción se entiende sin explicación.
3. Si la física, luces y sombras son coherentes.
4. Si hay deformaciones en manos, caras, producto, texto o reflejos.
5. Si el vídeo sirve para [objetivo concreto].
6. Qué corregirías en una siguiente iteración.
Devuelve una lista breve de problemas y un nuevo prompt de corrección.
Convertir una idea de campaña en clip antes de rodar. Útil para vender concepto, probar atmósfera y detectar si la escena tiene sentido.
Reformular un clip vertical, cambiar fondo, añadir movimiento, ajustar ritmo visual o crear una versión más clara para publicación.
Crear simulaciones simples para explicar física, procesos, historia visual o conceptos abstractos mediante escenas generadas.
Partir de fotos o vídeos existentes para crear variaciones manteniendo esencia, sujeto o encuadre. Perfecto para reciclar archivo.
Ensayar cámara, acción, iluminación y continuidad antes de invertir tiempo en producción real. No sustituye dirección: la obliga.
Puede servir para piezas donde una versión digital participa en el vídeo. Debe tratarse con consentimiento, límites y revisión ética.
Para una guía seria conviene explicar cuándo usar cada pieza del ecosistema Google, sin mezclar productos.
| Herramienta/modelo | Uso principal | Cuándo elegirlo |
|---|---|---|
| Gemini Omni Flash | Generación y edición de vídeo desde entradas multimodales y conversación. | Cuando tienes referencias y quieres iterar visualmente en la app, Flow o Shorts. |
| Veo 3.1 | Generación de vídeo de alta calidad con audio nativo y control cinematográfico. | Cuando necesitas producción de vídeo generativo más clásica o integración ya documentada. |
| Nano Banana / imagen nativa | Generación y edición de imágenes. | Cuando el resultado final es imagen fija o necesitas preparar referencias visuales. |
| Gemini Live API | Interacciones en tiempo real con voz, visión y texto. | Cuando el objetivo es conversación multimodal en directo, no generar clips finales. |
Hasta que Google publique documentación final, ejemplos y condiciones claras, la parte técnica debe quedar como “pendiente de actualización”.
Avatares, voces, personas reales y remix de vídeos ajenos requieren cuidado. Que una herramienta lo permita no significa que sea buena idea publicarlo.
Los modelos generativos todavía pueden fallar con rótulos, subtítulos o tipografía precisa. Mejor añadir texto final en edición cuando sea importante.
Un vídeo puede parecer físicamente coherente y aun así representar algo falso, exagerado o imposible. La revisión humana sigue siendo obligatoria.
Esta investigación se convertiría después en una guía completa de Academia HLT con enfoque más didáctico y menos “noticia”.
Para llevar esto al sistema local de Academia HLT, usaría un prompt cerrado: crear guía, actualizar biblioteca, validar idioma y copiar a deploy si ya está integrado ese flujo.
Usa la skill hlt-academia-publisher.
Tarea:
Crea una guía HTML pública para Academia HLT sobre Gemini Omni de Google.
Objetivo editorial:
Explicar qué es Gemini Omni, qué permite hacer ahora con vídeo multimodal, cómo usarlo con prompts y referencias, qué límites tiene y cómo aplicarlo en flujos creativos reales.
Material base:
Usa la investigación verificada sobre Gemini Omni, Gemini Omni Flash, Gemini app, Google Flow, YouTube Shorts, SynthID, C2PA, Veo 3.1 y Gemini Live API.
Reglas:
- Español de España.
- Tono HLT: claro, directo, práctico, editorial, crítico y sin humo.
- No inventes datos.
- Diferencia hechos verificados, interpretación y recomendaciones.
- No prometas API estable si solo está anunciada.
- No nombres fuentes internas ni rutas locales en el HTML público.
- Incluye método paso a paso, ejemplos, prompts copiables, errores frecuentes, checklist y ejercicio final.
- Mobile-first.
- Exportable a PDF.
- Máximo 2 imágenes si se añaden visuales.
Producción:
1. Crea la guía en output/html/.
2. Actualiza index.html.
3. Valida HTML.
4. Valida idioma y tildes.
5. Revisa que no haya rutas internas visibles.
6. Actualiza la carpeta deploy con la versión publicable.
7. Entrega rutas, resumen y advertencias de revisión.
Omni merece una guía porque cambia la pregunta: ya no es “qué prompt escribo”, sino “qué material, intención y corrección uso para dirigir una escena”.
Menos ruido. Más criterio.