PromptVault Guías de Vídeo
Imagen & Texto — próximamente
Guías de Prompting — Vídeo
Técnicas, estructura y ejemplos para Kling, Veo y Sora. Haz clic en las etiquetas para copiarlas.
kling 🎬
Kling 2.6 / 3.0
Kuaishou
Multi-shot
El modelo más controlable. Piensa como un Director de Fotografía.
Duración3–15 seg (3.0) / 3–10 seg (2.6)
Resolución720p / 1080p / 4K
Multi-shotHasta 6 planos (3.0)
Audio nativoSí (3.0) — diálogo + FX
I2VSí — preserva texto y logos
FPS30fps
Fórmula base (5 capas)
// 1. ESCENA — establece el entorno primero Interior de una cafetería japonesa nocturna, luz de neón rosa filtrándose por ventanas de cristal húmedo, // 2. PERSONAJES — describe con precisión una mujer de unos 30 años con abrigo negro y melena corta sentada sola, // 3. ACCIÓN — qué ocurre y cómo evoluciona levanta lentamente una taza de té, el vapor asciende en espiral, // 4. CÁMARA — movimiento + encuadre plano medio, dolly push-in lento hacia su rostro, foco suave en el fondo, // 5. ESTILO — estética + audio 35mm film grain, color grade teal-orange, ambiente tranquilo con lluvia suave exterior.
Sé específico en el orden: entorno antes que personaje, acción antes que cámara
Escribe como un párrafo fluido, no como lista de keywords
No mezcles el estilo al principio — va siempre al final
Dolly push-in
Intimidad, revelación emocional
"dolly push-in lento hacia su cara durante 3s"
Tracking shot
Seguir acción, dinamismo
"cámara sigue al personaje por el pasillo, hombro derecho"
Whip pan
Corte energético, transición
"whip pan derecha-izquierda, 0.5s, sin shake"
Crash zoom
Tensión, sorpresa
"crash zoom rápido al ojo derecho, luego pull back"
Handheld
Realismo, urgencia
"shoulder-cam drift, micro-vibración orgánica"
Static tripod
Contemplación, producto
"trípode fijo, sujeto se mueve en frame"
Regla de oro
"La cámara sigue al sujeto" ✓ mejor que "cámara se mueve a la derecha" ✗ Añade duración: "dolly push-in durante 4 segundos" — Kling respeta los tiempos
Estructura multi-shot
// Formato recomendado — cada shot independiente Shot 1 (0-3s): Plano general exterior, edificio industrial de noche, lluvia, luz cálida en ventanas. Shot 2 (3-7s): Interior, detective en mesa con documentos esparcidos, plano medio, luz de escritorio. Shot 3 (7-10s): Primer plano de sus manos pasando páginas, macro, profundidad de campo extrema. Shot 4 (10-13s): Su rostro mira a cámara. [Detective, voz grave y cansada]: "Esto no cuadra." Consistencia: Mantener chaqueta oscura, barba canosa, iluminación fría azulada en todos los planos.
Añade "Consistencia:" al final para fijar rasgos entre shots
Especifica duración por plano para controlar el ritmo
Mezcla planos estáticos y en movimiento para variedad natural
No pongas más de 6 shots — degrada la calidad
"35mm film grain"
"VHS camcorder aesthetic"
"shot on Super 8"
"color grade teal-orange"
"anamorphic lens flares"
"chromatic aberration"
"Black Pro-Mist 1/4 filter"
"shallow bokeh, f/1.4"
"golden hour rim light"
"cold blue interior"
"neon reflection on wet pavement"
"high contrast noir"
Prompt negativo útil
smiling, laughing, cartoonish, bright colors, low resolution, morphing, blurry text, disfigured hands, extra fingers
Formato de diálogo
// Etiqueta personajes explícitamente [Personaje A: Detective, voz controlada y seria]: "Lleva tres días mintiendo." Inmediatamente, el sospechoso se remueve en la silla, tenso. [Personaje B: Sospechoso, voz defensiva y aguda]: "Ya les dije todo lo que sé."
Describe el tono de voz: "voz grave", "susurro urgente", "tono infantil ansioso"
Añade acción después de cada línea para sincronizar gesto y voz
Para ambiente: "lluvia suave exterior", "eco de sala vacía", "bullicio de fondo"
No escribas diálogos que tarden más de 4-5 segundos en decirse
Principio base
Trata cada vídeo como una producción real. Define primero, genera después. La iteración desordenada = tiempo perdido + inconsistencia visual.
1
Define y fija tus personajes principales
Antes de generar nada, escribe una descripción detallada y fija de cada personaje que aparezca en más de una escena. Esta descripción es tu anchor text — cópiala en cada prompt donde aparezca ese personaje.
Plantilla de anchor text
Mujer, 30 años, piel morena, cabello negro corto a la mandíbula, abrigo gris oscuro entallado, pendientes pequeños dorados. Expresión seria y concentrada.
Guarda el anchor text en un bloc de notas para reutilizarlo sin reescribirlo
En Kling 3.0 usa la sección "Consistencia:" al final de prompts multi-shot
No describas el personaje diferente en cada prompt — rompe la consistencia visual
2
Explora el look visual — genera 3-5 shots de prueba
Antes de comprometerte con un estilo, genera variaciones del mismo shot con distintas estéticas. Cuando encuentres el look, escribe el style string — la parte del prompt que define la estética — y reutilízalo en todos los shots.
Ejemplo de style string guardado
35mm film grain, color grade teal-orange, luz natural de ventana lateral, bokeh suave en fondo, tono cinematográfico frío
3
Grid method — genera cobertura múltiple en un prompt
Para explorar ángulos rápido, pide a Kling una imagen en grid antes de animar. Genera 4-9 variaciones de un mismo momento con distintos encuadres para elegir el mejor antes de invertir en animación.
Prompt grid para Kling (fase imagen)
Create a 2x2 grid of [personaje + descripción] standing in [entorno]. High angle, medium shot, close-up, over-the-shoulder. [Emotion/acción]. Add a number to each frame 1-4.
Numera los paneles — facilita referirse a "el encuadre 3" al hacer el prompt de animación
Mezcla siempre al menos un wide y un close-up — da flexibilidad de edición
4
Storyboard manual — ordena antes de animar
Con los mejores stills seleccionados, ordénalos en secuencia antes de lanzar ninguna animación. Puedes hacerlo en Notion, Figma, Google Slides, o incluso en papel. La pregunta clave en esta fase no es "¿qué se ve bien?" sino "¿qué fluye bien?"
Evalúa la progresión narrativa plano a plano
Comprueba que los eyelines tienen sentido entre planos
Identifica qué shots son acción (Kling 3.0) y cuáles son diálogo/close-up (Kling 2.6 o LTX-2)
No animes hasta tener el orden narrative claro — es muy costoso reordenar después
5
Anima shot a shot — modelo correcto para cada tipo
No todos los planos necesitan el mismo modelo. Asigna el modelo antes de animar cada shot:
Kling 3.0 — usar cuando…
Acción rápida o impacto físico
Movimientos de cámara complejos
Reveals dramáticos
Secuencias multi-shot (hasta 6 planos)
Consistencia de personaje crítica
Kling 2.6 — usar cuando…
Close-ups y extreme close-ups
Planos de diálogo o performance
Shots estáticos con movimiento sutil
Iteración rápida de variantes
Menor coste de créditos
Prompt de referencia — acción intensa
Woman looking at the glass ball curiously as it starts to glow. Camera moves forward as the magic orb emits extreme energy. Violent shaking camera movement as orb emits energy. Her hair blows dramatically in the wind. [Style string aquí]
6
Valida la continuidad — revisa el corte antes del export
Importa todos los clips generados a tu editor (Premiere, DaVinci, CapCut) y haz un rough cut. Comprueba continuidad de movimiento entre planos, eyelines, y coherencia de luz. Es mucho más barato corregir aquí regenerando 1-2 shots que reconstruir todo.
Añade música temporal para evaluar el ritmo de edición
Si un shot no corta bien, regenera solo ese plano con ajuste de cámara
No hagas color grade hasta tener todos los shots definitivos
7
Post-producción final — refinar, no reconstruir
Con la secuencia locked, aplica color grade, diseño de sonido y texto/gráficos. Si usas audio nativo de Kling 3.0, mezcla con efectos y música en esta fase. El objetivo es pulir, no cambiar la estructura.
DaVinci Resolve para color grade profesional (gratis)
CapCut para montaje rápido con efectos de sonido
Premiere Pro si necesitas integración con After Effects
Checklist completo
1. Anchor text de personaje fijo → 2. Style string guardado 3. Grid de cobertura (2x2/3x3) → 4. Storyboard ordenado 5. Animar (3.0 acción / 2.6 close-ups) → 6. Rough cut + continuidad 7. Post: color + sonido + textos
veo 🌊
Veo 3 / 3.1
Google DeepMind
Audio nativo
El mejor en audio sincronizado y coherencia física. Piensa en párrafos, no en listas.
DuraciónHasta ~30 seg
Resolución720p / 1080p
AudioDiálogo, FX, música generativa
I2VSí — image to video
First/Last frameSí (3.1)
Prompt ideal100–150 palabras
Fórmula Veo (5 elementos)
[Composición] Plano medio a nivel de ojo, cámara fija en trípode. [Sujeto] Un marinero anciano de barba gris y gorra de punto azul, apoyado en la barandilla de un barco. [Acción] Señala el mar agitado con su pipa mientras habla con calma deliberada. [Entorno] Cielo encapotado de tarde, olas grisáceas al fondo, brisa visible en su ropa. [Estética] Estilo documental cinematográfico, color frío-azulado, grano sutil de película. Diálogo: "Este océano es una fuerza, salvaje e indomable. Y te exige respeto con cada ola."
Front-load el shot type: "Plano general..." al inicio pesa mucho en Veo
Un estilo visual consistente ("cinematic photorealistic") — nunca mezcles estilos
Evita palabras temporales como "todavía", "después", "continúa" — confunden al modelo
No hagas prompts de más de 200 palabras — el modelo se pierde
Wide / Establishing
Contextualizar, intro de escena
"A wide establishing shot captures..."
Medium shot
Personaje + acción equilibrada
"A medium shot frames the subject..."
Close-up
Emoción, detalle
"Extreme close-up on her hands..."
Slow push-in
Tensión creciente, intimidad
"Camera performs a slow push-in..."
Aerial drone
Escala, paisaje
"Aerial drone shot descending..."
POV
Inmersión, experiencia
"First-person POV walking through..."
Tip de orden
✓ "A slow push-in on a woman sitting by the window..." — cámara primero ✗ "A woman sitting by the window with a slow push-in..." — menos efectivo
Diálogo multi-personaje
// Diferencia personajes por descripción visual La mujer de rosa dice: "Pero soy yo quien lleva el abrigo rosa." El hombre con gafas responde: "No, yo soy el de las gafas." // Si pronunciación incorrecta → escribe fonéticamente "foh-fur" en lugar de "Fofur"
Diálogo corto: máx 8 segundos de speech por clip
Especifica ambiente sonoro: "lluvia en ventana", "eco de pasillo vacío"
Para música: "faint jazz piano in background", "swelling orchestral underscore"
Si los personajes son similares, Veo confunde quién habla — descríbelos diferente
"No subtitles" si no los quieres — el modelo los añade por defecto a veces
"realistic fluid dynamics"
"surface tension effects"
"volumetric light scattering"
"fabric draping naturally"
"momentum transfer on impact"
"particles dispersing with wind"
"condensation on glass"
"smoke wisps rising"
"bokeh depth of field"
"caustic light patterns"
"silk floating in air resistance"
"natural fold patterns"
Ejemplo física avanzada
"Two billiard balls collide with accurate momentum transfer, the impact creating realistic sound, separating at proper angles based on physics principles, rolling across green felt with natural deceleration."
Usa imágenes generadas con Gemini/DALL·E como referencias de frame
Ideal para: logo reveals, product transitions, loops seamless
El prompt describe la transición entre ambos frames, no el contenido
"Ingredients to video": sube referencias de personaje + escena para consistencia cross-shot
Workflow recomendado
1. Genera frame inicial con Gemini 2.5 Flash (Nano Banana Pro) 2. Genera frame final con el mismo estilo 3. En Veo 3.1: sube ambos como first/last frame 4. El prompt describe solo la acción intermedia
sora
Sora 2
OpenAI
Física IA
Máxima libertad creativa. El modelo rellena los huecos — úsalo a tu favor.
Duración4–25 seg (según plan)
Resolución720p (Plus) / 1080p (Pro)
Multi-shotSí — describe como shot list
AudioGeneración automática + control por prompt
I2VSí — image como input_reference
RemixSí — ajustes incrementales
Prompt corto — creatividad libre
Documental de los 90s. Un marinero sueco anciano en su estudio dice "Aún recuerdo cuando era joven." → Sora elige edad, vestuario, iluminación, cámara. Resultado sorprendente pero impredecible.
Prompt profesional — control total
Escena: Andén de metro al amanecer, niebla suave, luz ámbar de farolas prácticas. Cinematografía: Plano medio, ojo del sujeto a nivel de cámara. Lente 50mm esférica. Black Pro-Mist 1/4. Foco suave con bokeh en fondo. Acción: Viajero con maletín entra al frame por izquierda, camina hacia el tren. Paleta: Highlights ámbar cálido, sombras con lift teal sutil. Audio: Rumble del tren acercándose, pasos sobre hormigón, anuncio de megafonía distante. Diálogo: — (ninguno)
Prompt corto: deja huecos intencionados para que Sora sea creativo
Lo que omites, Sora lo inventa — controla qué dejas abierto
Parámetros técnicos (duración, resolución) van en la API, NO en el prompt
One Shot, One Thing
// ✓ Correcto — un movimiento + una acción "Cámara hace dolly push-in lento mientras ella levanta la taza" // ✗ Evitar — demasiado compuesto "Cámara hace dolly push-in, luego gira, mientras ella levanta la taza y mira por la ventana"
Lente 24-28mm
Gran angular, espacio, drama
"wide angle lens, slight distortion"
Lente 50mm
Natural, ojo humano
"50mm spherical prime, balanced"
Lente 85mm
Retrato, compresión
"85mm, shallow focus, soft background"
Anamórfico
Cinemático, lens flares
"anamorphic lens, horizontal flares"
Shot list en Sora
// Cada shot = bloque independiente Shot 1: Plano general exterior. Edificio industrial de noche. Lluvia. Luz en ventanas del 3er piso. Sin movimiento de cámara. Shot 2: Interior. Detective en escritorio. Plano medio. Luz de lámpara. Dolly push-in muy lento. Shot 3: Primer plano de manos sobre papeles. Macro. Trípode fijo. // Repite elementos de continuidad en cada shot Nota de continuidad: abrigo oscuro, barba gris, iluminación azul fría en todos los planos.
Repite la descripción de personaje/vestuario en cada shot — Sora no tiene memoria entre shots
Clips cortos (4s) cosidos en edición > un clip largo de 15s
Usa Remix para ajustes finos: "same shot, switch to 85mm lens"
No uses "después", "luego", "continúa" — cada shot es independiente
"Miyazaki animation aesthetic"
"Netflix documentary quality"
"Apple product demo style"
"90s camcorder VHS"
"shot on 16mm, high grain"
"cyberpunk neon aesthetic"
"warm golden hour"
"desaturated muted tones"
"film noir high contrast"
"hyperrealistic 4K"
"stop motion style"
"timelapse photography"
Establece el estilo al inicio
"Apple product demo style. A sleek black smartwatch rotates slowly on a marble surface..." → El estilo declarado al inicio condiciona todo lo que sigue
"Same shot, switch to 85mm lens" — cambia solo la lente
"Same lighting, new palette: cyan, sand, rust" — cambia solo el color
"Same composition, remove the umbrella from the background"
Si un shot falla, simplifica primero, luego añade complejidad
No uses Remix para cambios radicales — regenera desde cero
No modifiques más de 1-2 elementos a la vez
Workflow de iteración
1. Genera con prompt base simple 2. Identifica 1 problema concreto 3. Remix con cambio específico 4. Repite — 3-4 ciclos max antes de regenerar