Cómo hacer un reel como este
Te explico el flujo completo del vídeo que acabas de ver. Qué herramientas usa, cómo encajan, y cómo adaptarlo a tu marca.
01Qué vas a crear
Un vídeo vertical de unos 20 a 25 segundos que se siente hecho a mano, no generado por un ordenador.
Incluye:
- Una persona que habla a cámara, con cara y cuerpo muy realistas
- Planos de apoyo (paisajes, objetos, detalles) generados con IA
- Subtítulos palabra a palabra que resaltan con color
- Pantallas y elementos gráficos montados aparte
- Sonidos del entorno y una base musical discreta
- Una mezcla final optimizada para Instagram y TikTok
02Las herramientas que vas a usar
Todo lo que necesitas está en servicios online y en tu propio ordenador.
Inteligencia
- Claude: el cerebro que piensa el guion y toma decisiones creativas
Imagen y vídeo
- Nanobanana: genera los fotogramas clave de cada escena
- Kling: convierte esos fotogramas en vídeo de 5 segundos
Voz y sonido
- ElevenLabs: crea la voz, efectos de sonido y base musical
- Wavespeed: sincroniza los labios del personaje con la voz
Montaje final
- Remotion: programa que corre en tu ordenador y une todo
- FFmpeg: ajusta el volumen final para redes sociales
03Principios para que no parezca IA
Estos 8 principios son la diferencia entre un vídeo que alguien mira 2 segundos y otro que retiene hasta el final. Aplícalos todos.
Generando caras realistas
Siempre pasa 2 o 3 fotos del personaje como referencia cuando generes una imagen. Sin referencias, la cara cambia entre escenas y se rompe la ilusión.
Pide explícitamente: piel con poros visibles, asimetría natural de las cejas, algún pelo fuera de sitio. La perfección es lo que delata la IA.
Ropa que no se deforma
Evita estampados complejos o lemas grandes. Si el personaje lleva una camiseta con un patrón en zigzag, la IA lo irá cambiando frame a frame.
Usa ropa con colores lisos, pequeños detalles y textura natural. La tela con arrugas reales suma.
Movimiento creíble
Cuando animes un fotograma, el movimiento tiene que ser pequeño y natural. Frases que funcionan: "ligera respiración con cámara en mano", "el viento mueve ligeramente el pelo", "gestos naturales al hablar".
Evita zooms rápidos, giros de cámara y desenfoques cambiantes. Son señales clásicas de vídeo IA.
Sin marcos ni bordes de película
Nunca permitas que la imagen generada incluya bordes tipo Polaroid, Kodak, Super 8 o cualquier marco decorativo. La imagen siempre ocupa toda la pantalla, de borde a borde.
Clips cortos, no largos
Cada plano de IA debe durar 5 segundos o menos. Si estiras más, la IA empieza a alucinar y aparecen deformaciones evidentes.
Dos capas que unifican todo
El montaje final aplica dos capas sutiles sobre todo el vídeo: un grano de película (textura suave) y una subida ligera de saturación y contraste.
Esto hace que los planos generados y los elementos gráficos se sientan parte del mismo mundo.
Subtítulos con textura aerosol
Los subtítulos llevan un filtro que les da un ligero desenfoque orgánico, como si estuvieran pintados con aerógrafo. Les da identidad visual sin recurrir a tipografía chillona.
Sonido del entorno, bajo de volumen
Cada escena lleva uno o dos sonidos del entorno (olas, teclado, voces lejanas). Son los que hacen que el espectador sienta el plano, aunque no los escuche conscientemente.
Volumen muy bajo: si el oyente los nota, es que están demasiado altos.
04La estructura del guion: 9 frases
Todo reel de este sistema se cuenta en exactamente 9 frases. Ni una más ni una menos. Cada frase cumple una función concreta.
Copia esta plantilla y rellena con tu tema:
Frase 1 · Gancho: una afirmación fuerte o un desafío al espectador Frase 2 · Prueba rápida: qué construiste o viste funcionar Frase 3 · Promesa: qué es capaz de hacer esto Frase 4 · Herramienta 1: primer ingrediente clave Frase 5 · Herramienta 2: segundo ingrediente Frase 6 · Tu toque: qué lo hace único en tu caso Frase 7 · Filosofía: el principio en 2 palabras Frase 8 · Resultado: qué consigues con todo esto Frase 9 · Llamada: comenta X y te mando Y
El método Claude
Seis módulos para dominar Claude y construir sistemas útiles. Plantillas, pipelines y ejemplos paso a paso.
Ver el método →05Voz
Graba tu voz con ElevenLabs o usa una voz clonada. Le pasas tu guion y el servicio te devuelve el audio y un listado con el tiempo exacto en el que suena cada palabra.
Ajustes que funcionan bien:
- Estabilidad alta (un valor cercano a 0.8), así no mete pausas raras entre palabras
- Fidelidad a la voz original alta (cerca de 0.9)
- Estilo moderado (alrededor de 0.2), para que suene natural sin exagerar
06Fotogramas clave
Un fotograma por escena humana. Las pantallas y ventanas gráficas no las generes con IA: las montas aparte en Remotion. Quedan mejor y son más rápidas de hacer.
La plantilla de descripción que le pasas a la IA siempre tiene estos 6 bloques:
- Tu personaje: rasgos faciales concretos (edad, pelo, piel, mirada)
- Tu vestuario: ropa descrita con detalle, sin estampados complejos
- La acción: qué está haciendo exactamente
- La cámara: tipo de plano y encuadre vertical
- La luz: dirección, temperatura, contraste
- El ambiente: la sensación general del plano
07Animación
Coges el fotograma y le pasas una instrucción de movimiento. La IA genera un vídeo de 5 segundos.
Instrucciones que funcionan:
- "ligera respiración con cámara en mano, un leve acercamiento"
- "el viento mueve el pelo hacia la derecha, gesto natural al hablar"
- "pequeña sonrisa cómplice que aparece en el segundo 2"
Importante: usa siempre el modo "imagen a vídeo". El modo "principio y final" deforma la ropa entre fotogramas.
Sincronizar labios (solo si habla a cámara)
Cuando el personaje habla directo a cámara, le pasas el vídeo animado y el trozo de audio que corresponde, y el servicio te devuelve el vídeo con los labios sincronizados a la voz.
08Montaje
En un ordenador normal, con Remotion, escribes la composición como si fuera código. Tiene tres partes clave:
- Los bloques de tiempo: qué plano o pantalla se ve en cada segundo
- Los subtítulos: palabra a palabra, con resaltados de color en las más importantes
- El audio: voz, efectos del entorno y base musical, cada uno con su volumen
09Mezcla final
Una vez montado, pasa el vídeo por FFmpeg con un ajuste de volumen que lo prepara para Instagram y TikTok. Esas plataformas aplastan audio que les llega demasiado alto, así que conviene entregarlo ajustado de antemano.
Portada
Elige un fotograma del primer segundo para la portada. No uses un frame en negro o una transición. La portada es lo que la gente ve en el feed antes de darle play.
10Comprobar antes de publicar
Repasa esta lista cada vez. Son 9 puntos, te lleva 2 minutos.
- Duración total: 27 segundos o menos
- Los subtítulos se leen al pausar en cualquier frame
- Ningún plano parece IA (hay poros, asimetrías, sombras coherentes)
- La música no pisa ninguna palabra (compruébalo con auriculares)
- La llamada a la acción aparece sola y grande en la última tarjeta
- La portada es un fotograma nítido, no una transición
- El pie de foto contiene la palabra clave exacta del automático
- El automático está activo y lo has probado en privado
- El volumen final está ajustado para redes sociales
Cómo automatizarlo para que se haga solo
Ahora que sabes producirlo a mano, automatízalo. Un agente hace el reel mientras duermes, tú solo revisas al despertar.
Abrir guía madrugón →