VENDEX

Aprende a obtener mejores resultados

Cómo escribir instrucciones claras y combinar imágenes de referencia

Esta guía explica, paso a paso, cómo estructurar lo que pides, cómo mezclar foto1, foto2 y más referencias visuales, y cómo iterar sin frustrarte. Está escrita en lenguaje sencillo, sin tecnicismos de plataforma.

Introducción: qué es una buena instrucción

Escribir “bonito” o “estilo iPhone” rara vez basta. Los sistemas de creación de imágenes a partir de texto y de referencias visuales interpretan intención, prioridad y límites: qué quieres conservar, qué quieres cambiar y qué deseas dejar sujeto a creatividad.

Piensa en tu mensaje como en un encargo a un diseñador excepcional que no conoce tu negocio: debes fijar el blanco, el estilo, el público y las piezas fijas, sin asumir que “ya se entiende” por el contexto.

Objetivo de esta guía

Aprender a planificar, redactar y perfeccionar lo que pides, incluida la forma correcta de citar foto1, foto2 (y más) cuando subes varias imágenes, para que el resultado sea coherente, usable en redes y fácil de ajustar en una segunda o tercera pasada.

Para quién es esta guía

Dirigida a creadores de anuncios, comercios y agencias ligeras que usan el generador con instrucción libre o con fotos de producto, local o equipo.

Qué vamos a lograr juntos

  1. Claridad: que cada palabra tenga un rol.
  2. Control: decidir el peso de cada referencia.
  3. Iteración: ajustar sin reescribir todo desde cero.

Anatomía de un prompt: capas, no una sola oración

Trata de dividir lo que pides en capas lógicas. No es obligatorio escribir “apartados” con títulos; basta con que mentalmente separes:

  1. Sujeto principal: qué o quién es el foco (producto, persona, fachada, etc.).
  2. Acción o escena: qué pasa, si aplica; si no, “bodegón / retrato de estudio / plano fijo”.
  3. Entorno y encuadre: interiores, calle, mesa, ventana, plano entero, primer plano.
  4. Estética y referencias culturales: “anuncio limpio”, “look cafetería artesanal”, “revista de moda 90s” (sin nombres de marcas ajenas a la tuya, si aplica a políticas del servicio).
  5. Cámara y luz (opcional): 50mm, poca profundidad de campo, luz lateral, ventana suave.
  6. Exclusiones y negaciones: qué no quieres ver (texto borroso, manos de más, logo duplicado).

Escribir en capas reduce ambigüedad: el modelo puede satisfacer un bloque aunque otro falle, y tú localizas qué afinar en la iteración.

Capa 1: botella de café 350 ml, etiqueta frontal nítida.
Capa 2: sobre mesa de madera clara, mano sosteniendo, fondo de cafetería desenfocada.
Capa 3: luz de tarde, sombras suaves, estética "anuncio para Instagram" sin saturar.
Capa 4: sin texto adicional, sin múltiples logotipos, sin otras bebidas en primer plano.

Intención, tono e intérprete de la marca

Antes de describir píxeles, define el para qué sirve el creativo. Formúlalo en una frase: “anuncio de apertura de local”, “post de dulce artesanal para Día de las Madres”, “story 9:16 con producto en mano y CTA sutil”.

Público y registro de habla

Menciona el público implícitamente: “familias de zona urbana en El Salvador”, “jóvenes 18-30 con estilo relajado”. Eso afecta colores, vestuario de modelos, tipografía (si pides “espacio de titular”) y escenarios.

Emoción y promesa (sin exagerar)

Pídelo en términos visuales: “calidez”, “frescura”, “urgencia suave (sin alarmismo)”, “confianza y orden”. Evita promesas médicas, financieras o legales dudosas: el riesgo no es solo legal, es que el generador recomponga escenas poco adecuadas.

Mini plantilla de intención

“El creativo tiene que dejar claro [beneficio] para [público] con sensación [emocional] y sin [elementos excluidos].”

Detalle visual: luz, color, cámara y coherencia

Cuanto más observable sea lo que pides, menos interpretación al azar. “Bonito” es subjetivo; “luz de ventana lateral y sombras alargadas” no.

  • Luz: dura o suave, de frente, lateral, contraluz, hora aproximada (amanecer, noche, estudio con softbox visible o no visible).
  • Color: gama cálida o fría, “colores alimentarios naturales” vs. “fondo pastel uniforme”.
  • Cámara: 35mm, 50mm, top-down, ¾, macro; profundidad de campo explícita.
  • Materia: qué se debe sentir (textura sólida, brillo, rugosidad); útil en comida, textiles y piel. En escenas con personas, respeta el consentimiento y evita detalles indebidos o primeros planos de menores sin contexto adecuado.

Continuidad de serie (misma campaña)

Si buscas 8 piezas con la misma familia, fija: paleta, tipo de luz, estilo de encuadre, presencia o ausencia de manos, y un criterio de fonde (siempre sólido / siempre ambiente de tienda, etc.)—así reutilizas la misma “receta” con pequeñas variaciones y una iteración breve: “cambia el producto, conserva luz 50mm f1.8 y banco cálido”.

Texto dentro de la imagen: titulares, precios y legal

Pide texto corto y, si aplica, la jerarquía: titular, subtítulo, condiciones en letra mínima. Especifica idioma, mayúsculas, y dónde va el logotipo (arriba a la izquierda, sello, etc.) si en tu flujo aplica. Si no deseas letras, dilo explícitamente: “sin copy superpuesto; solo el logo existente de la referencia en posición fija”.

Cómo pedir letras legibles

Indica: contraste, margen, área de respiro, “máx. 6 palabras en titular”, y que el texto no corte bordes del encuadre. Si la primera tanda falla, no reescribas todo: añade “aumenta contraste entre texto y fondo, sin añadir más líneas de copy”.

Marcas, descuentos y ofertas

Para evitar sorpresas, enumera: porcentaje exacto, fechas, “IVA incluido” si aplica, y la forma del sello: “banda amarilla”, “burbuja con borde”.

Verifica tú el texto de salida: los sistemas pueden alterar cifras o deletrear palabras. No uses el generador para sustituir a un diseñador o abogado en publicidad regulada; úsalo como boceto.

Titular: "2x1 en postres" (7 palabras máx, sans-serif, alto contraste)
Sub: "Solo 10 al 12 de agosto" (más pequeño, misma fam tipográfica, sin otras ofertas.
Logo: respetar proporción, esquina superior izquierda, 10% de ancho.

Referencias: orden de carga, foto1, foto2, foto3

En la práctica, la mayoría de flujos que permiten múltiples imágenes usa un orden fijo de carga. Aquí y en la aplicación, ese orden se llama a menudo foto1, foto2, foto3, foto4, foto5. La regla de oro: lo que subes primero no es “más importante” automáticamente; la importancia la defines tú con palabras.

Cómo nombrar y referenciar en el texto

Escribe antes de detallar el escenario final, una asignación explícita del tipo:

  • foto1 = producto a conservar: forma, etiqueta, color aproximado del envase.
  • foto2 = fondo, ambiente o interiores deseados.
  • foto3 = paleta o look de edición, sin copiar un logo ajeno; solo atmósfera cromática.

Usa nombres exactos y repetidos a lo largo del encargo, no mezcles “imagen 1 / primera foto / A” en distintas frases, ya que se diluye el vínculo.

Asignación (ajusta el índice al orden en que subiste las imágenes):
- foto1: botella, conservar logotipo y silueta.
- foto2: fachada de la tienda, tomar luz cálida y desenfocado.
- foto3: tablero de madera de referencia, SOLO colores, sin textos ajenos.

Composición final: botella (como en foto1) en primer plano, superpuesta
suavemente sobre entorno (como en foto2), paleta cromática inspirada
en (foto3) sin añadir textos ajenos.

Roles: producto, estilo, escena, rostro, textura

Roles típicos: foto1 producto, foto2 entorno, foto3 estilo, foto4 rostro/look de modelo (o uniforme de equipo) y foto5 piso/textura. Si dejas foto4 vacío o reutilizas, dilo, para no “inventar” alguien que se parezca a referencias ajenas.

Si una referencia es solo de color, escribe: “foto3 aporta solo la gama, no paisajes ni letras de foto3”.

Cuando dos referencias pugnan

Prioriza: “Prioridad 1: silueta de foto1. Prioridad 2: iluminación de foto2. Si hay conflicto, gana 1 y suaviza 2.” Esto ahorra ciclos de reintento. Evita 5 prioridades 1. Ideal: una prioridad, una secundaria, un plan B (“si hace falta, simplifica el fondo manteniendo textura baja”).

Recuerda

Si foto1 es poca resolución o con mucho ruido, pide reconstrucción fiel a silueta y tipografía, no “aumenta creatividad” a ciegas, o se alejará del producto real.

Combinar varias imágenes: mezcla, reemplazo y montaje

Qué pide en cada receta (plantillas de intención)

  1. Apariencia a partir de otra toma (sin inventar otra fábrica): “Aplica a la composición la misma luz, contraste y dominancia cromática que foto2, sin añadir objetos concretos de foto2 salvo que los pidas explícitamente.”
  2. Composición de recorte (producto + escena distinta): “Coloca toda el área de producto/etiqueta de foto1 encima de el plano de foto2, ajusta perspectiva suave, sin torsionar el logotipo.”
  3. “Sólo mosaico cromático” de foto3: “Mapea cielo y piel/áreas a tonos cálidos, sin copiar cielo literal.”

Poner un objeto reemplazando otro (con cuidado)

Instruye: qué reemplaza a qué en términos de geometría: “lata roja (foto1) en mano, donde ahora sostiene otra lata (foto2)”. Si es demasiada libertad, el rostro, postura o mano pueden cambiar; entonces añade: manos, postura, rostros no inventar; mantener cuerpo de referencia 2, solo cambia el empaque (si aplica a políticas y derechos de imagen).

Si trabajas con personas reales no modelos con contrato, asegúrate de que tu uso cumple con normas y permisos; esto no se soluciona con buen prompt, sino con decisiones y consentimiento adecuados.

Edición frente a generación: cuándo conviene cada una

Si ya tienes una imagen aceptable, el siguiente paso suele ser cambio local (“cambia el color del cielo”, “haz el fondo sólido #F5E6D3”) en lugar de reescribir 200 palabras. Indica: área afectada + preservar todo lo demás.

  • Mantener: un bloque añadido: “Mantener identidad de producto/etiqueta, iluminación y encuadre, salvo ajuste de…”.
  • Reemplazo global: deja de pedir 15 cosas: “Rehaz solo el fondo a estudio, sin tocar sujeto.”

Si el sistema no acepta retoques puntuales, reescribe el encargo reduciendo 60% y repitiendo la asignación foto1, foto2, etc. en una o dos frases, más una cláusula de “sin cambios en…”. Esto a menudo baja alucinaciones estructurales.

Iterar de forma productiva: un cambio a la vez

Cada pase, limita a un eje de cambio principal: o la luz, o el recorte, o el color de fondo, o el grosor de sombra, o el desenfoque, o el CTA, etc. Añade un cambio secundario solo si es dependiente (“si oscureces, mantén piel con tono natural, sin anaranjado fuerte”).

  1. Pasada 1: estructura y ley básica de composición; referencias fijas.
  2. Pasada 2: afinar luz y color, sin tocar sujeto.
  3. Pasada 3: tipografía, sellos, detalle en textura, sin mover encuadre.

Si algo “no se pega” tras tres intentos, simplifica la escena, reduce foto2 a un solo criterio, o pasa de cinco a tres referencias y vuelve a añadir.

Fórmula de seguimiento

“Mantener exactamente: [lista corta de lo aprobado de la tanda previa]. Ajustar solo: [X].”

Errores frecuentes y cómo corregirlos en una línea

  • Demasiada metáfora: “hazlo épico, como un atardecer inolvidable en el alma” → reemplaza por luz, hora, color, encuadre.
  • Roles mezclados de fotos sin nombrar: añade la tabla foto1foto5 y una cláusula de prioridad.
  • Cinco referencias, cinco tareas 100% a la vez: baja a una prioridad, una secundaria, otras como “muy suaves” o elimina 1–2.
  • Confundir “estilo” con “copiar otra campaña” de terceros: pide gama, ritmo, tipos de cámara, no lemas ni señalética ajenas.
  • Texto de salida ilegible: pide “mayor contorno, mayor margen, menos líneas, solo titular+sello, sin márgenes a 0 píxel”.

Formatos, encuadre y redes sociales

Aunque el generador no “cambia de sensor”, puedes fijar el propósito del encuadre final para que la composición deje aire a titulares, a la interfaz de la red o a subtítulos en reels.

Cómo pedir 1:1, 4:5, 9:16 o 16:9 sin contradicción

Indica: relación de aspecto deseada del lienzo final y, si aplica, “sujeto centrado en 4:5 aunque haya aire en la vertical total” o “9:16 con sujeto en tercio inferior (espacio reservado arriba para título)”. Así se evita que un primer plano quede en el tercio superior cuando la plantilla pone texto en la parte baja (stories) o al revés.

  • Feed cuadrado 1:1 — clásico; buen bodegón y producto. “Producto ligeramente bajo el centro para equilibrio.”
  • Feed vertical 4:5 — más imponente; “línea de horizonte o mesa a un tercio, no en el centro exacto, salvo look simétrico.”
  • Story o Reel 9:16 — “zona nítida del sujeto en 60% central; bordes suaves, sin manos o texto recordatorio cortados.”
  • Horizontal 16:9 — “pensado para miniatura o sitio: regla de tercios, ojo a espacio vacío a izquierda o derecha para título fijo de marca en post.”

Zona segura y sobreimpresos

Pide márgenes: “mín. 5% de margen libre a cada borde con producto, logo o rostro, para que el recorte de la red o el redondeo de story no corte bordes.” Si foto1 trae un pack muy pegado al borde, añade: reconstrucción sutil con margen, sin recortar el logotipo.

Si usas foto2 como fondo, limita: “desenfocado, sin detalles críticos en el 10% superior (donde a veces va el @ o botón)”. Esto ajusta a patrones reales de interfaces, sin nombres de producto.

Ejemplo 9:16: Lienzo 9:16, sujeto (como en foto1) en tercio inferior;
15% de aire claro en la parte superior para titular, sin poner texto en la
imagen. Fondo tomado de la atmósfera de foto2, muy suave.

Flujo de trabajo: de la idea al anuncio afinado

Paso 1: boceto en 3 frases, sin lujo

Escribe: (1) qué debe mostrarse, (2) dónde podría vivir, (3) un criterio de luz. No subas aún cinco imágenes a la vez. Cuando tengas una dirección, pasa a referencias y roles.

Paso 2: subir y nombrar foto1, foto2…

  1. Sube en el orden con el que luego te sentirás cómodo recordando. Verifica: la primera carga = foto1, la segunda = foto2, y así en adelante.
  2. En el texto, copia pega el mismo rótulo que viste al subir, sin renombrar a “A/B” en otra frase.
  3. Si foto3 es de moodboard, añade en la primera línea: solo gama, no letras, no personajes, no productos terceros.

Paso 3: convertir en encargo de una pantalla

Únete: asignación de foto1foto5, prioridad, una exclusión, un ajuste de aspecto, y (opcional) guión de CTA. Genera, evalúa, aplica la fórmula de seguimiento de la sección de iteración, no 12 cambios a la vez.

Ritmo recomendado

Tres tandas: estructura → luz y color → textura y type (si aplica). Cada tanda, una o dos variables.

PyME, retail y ofertas estacionales

Para campañas locales, el gancho suele ser claridad + credibilidad, no falsa épica. Nombra el tipo de oferta, la vigencia, un motivo (fiesta, día, temporada) y el canal si influye al encuadre (carrusel, story con botón, etc.) sin tecleces.

  • Comida o bebidafoto1 plato o envase, foto2 entorno, “sin vapor exagerado que tape el plato, salvo que sea el héroe”.
  • Moda básicafoto1 prenda, foto2 textura; “sin cambiar el pliegue real del tejido que viene en foto1”.
  • Servicio (taller, belleza, consultorio) — “espacio limpio, manos o herramientas con nitidez en zona segura, sin replicar un estudio ajenas” (solo atmósfera, no señalética ajenas).

En fechas clave, repite en el encargo: nombre del hito, rango de días, y región si el tono (colorido, luz) debe sentirse “local, fin de semana, sin genérico navideño internacional”.

Oferta: "2x1 en [producto]" visible, fechas: 1–7 de x.
foto1: el artículo real en su empaque.
foto2: mostrador o vitrina, desenfocado, sin otras ofertas legibles ajenas.
Prohibido: añadir sellos o marcas de otras cadenas, copiar rótulo de
ningún tercero.

Checklist final antes de generar o de una nueva iteración

  1. Sujeto y uso: ¿Qué y para qué red social/fragmento? ¿Aspecto 1:1, 4:5, 9:16, 16:9?
  2. Referencias: Cada fotoN con rol, prioridad, y “solo color / con objeto / con ambiente”.
  3. Luz y cámara: Aunque sea una pista, escribe algo concreto.
  4. Exclusiones explícitas: manos, logos extra, texto, props que confundan.
  5. Plan B: qué ceder en caso de choque (ej.: simplificar fondo, mantener producto).
  6. Derecho y respeto: rostros, marcas, menores, propiedad, políticas de la plataforma; si dudas, pide paisaje o producto sin gente.

Si marcas 5/6, tu próximo paso rara vez es “hazlo más lindo”, sino añadir la pieza faltante en una oración o recortar prioridades.

Ética, transparencia y buenas prácticas con IA visual

Trata a las personas, los trabajos artísticos ajenos y a tu audiencia con honestidad. No simules reseñas, sellos o documentos. Si anuncias colaboración con creador real, asegúrate de que haya aprobación y verdad. Si la política o la ley exige señalizar material sintético, complétalo fuera o dentro del anuncio según toque.

Un buen criterio de diseño te protege: fuentes y logos deben alinearse con tu guía, no con la primera salida. Usa el generador para acercarte y comprueba números, nombres y marcas; si trabajas con fotógrafo, combina: referencia fija, generación, y ajuste humano al final. Así, foto1 a foto5 dejan de ser un caos y pasan a ser roles claros de un mismo equipo.

Gracias por leer: retoma esta guía, adapta el idioma a tu marca (formal, cercano, picante) y, sobre todo, aplica un cambio a la vez hasta que el resultado haga justicia a lo que ofreces.