Edición de imágenes AI12 min read

Edición de imágenes con Nano Banana: ruta, prompt y cuándo parar

Cómo elegir entre Gemini, Search/Lens, AI Studio/API, provider API, editor de terceros o editor tradicional antes de editar una imagen con Nano Banana.

Yingtu AI Editorial
Yingtu AI Editorial
AI Technology Writer
19 dic 2025
12 min read
Edición de imágenes con Nano Banana: ruta, prompt y cuándo parar
yingtu.ai

Contenido

No se detectaron encabezados

Nano Banana puede editar una imagen cargada, pero la primera decisión no es escribir un prompt más largo. Primero hay que elegir la ruta. Gemini sirve para una prueba oficial y rápida con material seguro. Search o Lens encajan cuando la tarea nace de una foto del móvil. AI Studio o Gemini API son mejores cuando necesitas model ID, registros, límites de proyecto y repetición. Un provider API puede servir para automatizar, siempre que sus condiciones estén claras. Un editor de terceros sirve para trabajo de bajo riesgo, y un editor tradicional sigue siendo la mejor opción cuando importan texto exacto, logotipos, documentos, material de clientes o activos regulados.

Ruta de ediciónCuándo usarlaCuándo parar
Gemini appQuieres el flujo oficial de consumidor para una edición rápidaNo trates el resultado de Gemini como contrato de API o provider
Search / LensLa tarea empieza con una foto del móvil o una búsqueda visualNo subas caras privadas, documentos o material de clientes para probar un atajo
AI Studio / Gemini APINecesitas model ID, logs, límites y pruebas repetiblesRevisa modelo, cuota y error antes de cambiar key o proveedor
Provider APINecesitas automatización, lotes o facturación unificadaVerifica modelo, precio, retención y manejo de errores
Editor de tercerosQuieres un flujo de navegador o chat para usuarios no técnicosComprueba créditos, derechos, privacidad y ruta real de llamada
Editor tradicionalNecesitas píxeles exactos, marca, texto o material legalPara si identidad, texto, logo o geometría fallan dos veces

Mapa de rutas para edición con Nano Banana

Un prompt fiable empieza por lo que debe quedar intacto. Conserva la identidad de la persona, la pose, la luz, el ángulo de cámara y la distribución del fondo. Cambia solo la chaqueta azul a negro mate. No añadas accesorios. Mantén todo el texto visible legible. Esa estructura deja claro qué puede modificar el modelo y qué no debe tocar.

Estructura de prompt para Nano Banana

Si dos intentos cambian el objeto equivocado, dañan una cara, rompen texto o logo, o degradan la calidad, el problema suele estar en la ruta y no en la falta de adjetivos. Antes de subir una imagen, descarta caras privadas, documentos de identidad, productos de cliente no publicados, pantallas médicas o financieras y material con derechos inciertos. Una vista previa bonita no equivale a una entrega segura.

Qué significa editar imágenes con Nano Banana ahora

Nano Banana se usa como nombre de mercado para capacidades de Google relacionadas con generación y edición de imágenes. El contrato práctico cambia según la entrada. En Gemini aparece como experiencia de modelo de imagen y edición fotográfica para usuarios. En documentación de desarrolladores, las rutas se separan por modelo: Nano Banana 2, Nano Banana Pro y la Nano Banana original pueden tener caminos API distintos. Los editores de terceros suman sus propios créditos, almacenamiento, derechos de salida y soporte.

Esa diferencia importa en cada edición. Un prompt que funciona en Gemini no se convierte automáticamente en proceso de producción para un API, un provider endpoint o un wrapper de navegador. Conviene tratar Nano Banana como una decisión de ruta más un flujo de prompt. Inpainting es solo una modalidad. Quitar objetos, cambiar fondos, conservar una cara al modificar ropa, combinar referencias o preparar un product mockup requieren restricciones diferentes.

Un dato estable para decidir es que las imágenes generadas o editadas con Google AI incorporan SynthID. Los datos que no conviene congelar son los numéricos: intentos gratuitos, créditos de provider, precio por imagen, resolución máxima, velocidad, retención y derechos comerciales pueden variar por cuenta y por ruta.

Elige la ruta antes de subir la imagen

Gemini app funciona cuando la imagen es segura y solo quieres comprobar una idea visual. Adjunta la imagen, pide un cambio, mira el resultado y haz una o dos iteraciones estrechas. Es una buena superficie de consumidor, pero no sirve para depurar model IDs, comportamiento batch, límites de provider o gobierno de activos.

Search o Lens encajan en tareas que nacen cerca de la cámara: una foto del teléfono, una referencia visual, una exploración rápida. Esa cercanía es cómoda, pero no es una superficie limpia de producción. Si la imagen contiene una persona reconocible, un documento, un producto de cliente o material de marca no publicado, mueve el trabajo a una cuenta y ruta que puedas auditar.

AI Studio o Gemini API son adecuados cuando necesitas repetición. Si un equipo va a procesar imágenes de producto, probar variantes o comparar el mismo prompt en un lote, el API permite ver model ID, request logs, project limits y tipos de respuesta con mucha más claridad que un chat de consumidor.

Un provider API o un editor de terceros solo debería entrar cuando queda claro quién controla las condiciones. Un provider puede ayudar con automatización, facturación y acceso a modelos, pero sus reglas gobiernan créditos, almacenamiento, manejo de salidas y soporte. Un editor de navegador puede ser cómodo, pero no debe tratarse como ruta first-party de Google si Google no lo afirma.

Flujo seguro de subida

Clasifica la imagen en riesgo bajo, medio o alto. Bajo riesgo incluye demos sintéticas, borradores públicos, escenas sin personas privadas ni información de clientes. Riesgo medio incluye personas reconocibles, elementos de marca y activos que el equipo puede procesar pero que requieren cuidado. Alto riesgo incluye documentos, caras privadas, registros médicos o financieros, productos no publicados, material confidencial de clientes y capturas con datos de acceso.

Para bajo riesgo, una ruta de consumidor suele bastar. Aun así, pide un cambio por vez y separa objetivo, detalles protegidos y criterio de salida. Para riesgo medio, usa una cuenta y ruta con políticas visibles de almacenamiento, permisos y uso comercial. Para alto riesgo, no uses un wrapper público ni una prueba casual; usa una herramienta aprobada, un editor tradicional o una ruta de producción con contrato de tratamiento de datos.

El primer prompt debe parecer una especificación de edición: conserva la cara, pose, iluminación, ángulo de cámara y distribución del fondo; cambia solo la chaqueta azul a negro mate; no añadas accesorios; mantiene todo el texto visible sin cambios y legible. Después de generar, revisa lo que debía permanecer intacto, no solo si la imagen se ve atractiva.

Si cambia la identidad, el prompt falló. Si cambian la luz o la perspectiva, la cláusula de preservación fue débil o la ruta no era adecuada. Si se rompen texto o logotipos, no intentes que el modelo corrija tipografía exacta; usa AI para dirección visual y termina esa capa en un editor tradicional.

Prompts que sí ayudan

La eliminación de objetos mejora cuando defines el relleno esperado. En vez de “quita esto”, escribe: elimina el cubo rojo junto a la puerta y continúa de forma natural la pared de hormigón, la sombra del suelo y la luz del lado izquierdo. Si el objeto tapaba información desconocida, acepta el relleno como plausible, no como reconstrucción factual.

El cambio de fondo necesita una preservación más fuerte. Conserva cara, contorno del pelo, pose, forma de la ropa y perspectiva de cámara; reemplaza la pared lisa por un fondo de estudio gris cálido con luz suave. Si el color invade el pelo o cambia el borde, intenta una vez con un cambio más estrecho y después pasa a un editor por capas.

El style transfer debe separar lo variable de lo protegido. “Hazlo cinematográfico” es demasiado amplio. Mejor: conserva forma del producto, etiqueta, texto visible y ángulo de cámara; cambia la luz hacia un look editorial de tarde; añade poca profundidad de campo; no alteres logo ni geometría del envase.

Un product mockup exige lenguaje geométrico estricto. Conserva dimensiones, posición de etiqueta, forma de tapa y todo el texto. Cambia solo reflejo de superficie y fondo. Si el modelo dobla letras, inventa detalles de etiqueta o cambia proporciones, detén la capa AI y coloca manualmente el arte aprobado.

Cuando combines imágenes, explica la función de cada referencia. La segunda imagen puede ser mood reference, material reference, identity reference o composition reference. Sin prioridad, el modelo mezclará estilo, postura y materiales en un resultado bonito pero difícil de controlar.

Fórmula de prompt

Reglas para detener una edición con Nano Banana

Para la mayoría de ediciones usa este orden: target, preserve, change, context, constraints, output check. Target nombra el objeto, persona, zona o fondo que puede cambiar. Preserve protege identidad, pose, luz, ángulo, composición, texto, logo, geometría de producto y elementos de fondo. Change define color, material, posición, estilo o entorno. Context añade solo lo necesario para entender la escena. Constraints dice qué no añadir, qué no recortar y qué debe seguir legible. Output check define de antemano lo inaceptable.

El bloque preserve es lo que más se omite. También es la diferencia entre una edición útil y prompt stuffing. Si necesitas conservar texto exacto, logotipo, etiqueta de producto, rostro o material legal, el modelo puede servir para exploración, no para la capa final.

Las instrucciones negativas ayudan solo si son concretas. “No lo hagas raro” no es una frontera. “No cambies cara, manos, logo, texto, ángulo de cámara ni distribución del fondo” sí da límites. El prompt no necesita ser largo; necesita decir qué puede cambiar, qué debe quedarse igual y cómo detectar el fallo.

Cuando una edición falla

Si cambia el objeto equivocado, el target era ambiguo. Añade posición, color, tipo de objeto y relación con elementos cercanos. “Cambia la silla” pasa a ser “cambia la silla roja pequeña detrás de la mesa de madera, en el lado derecho, por una silla metálica negra”.

Si aparece identity drift, la persona no está suficientemente protegida o la ruta no sirve. Añade same person, same facial structure, same age impression, same expression y same pose, y prueba una sola vez. Si vuelve a cambiar la cara, para.

Los errores de texto y logo no son detalles cosméticos. Los modelos de imagen pueden producir letras plausibles mientras cambian caracteres, espaciado o geometría del símbolo. Para empaques, UI, señalética y contenido parecido a documentos, usa AI para exploración y termina el texto exacto en un editor tradicional.

La pérdida de calidad tras varios intentos es señal de reinicio. Vuelve a la imagen original, pide una edición más estrecha o cambia de ruta. Editar salidas generadas una y otra vez acumula blur, iluminación plana y textura artificial.

Si la ruta se bloquea, diagnostica la ruta. Si falla Gemini, compara la misma cuenta en otra entrada. Si falla el API, revisa model ID, project limits, response class y request logs. Si falla un wrapper, comprueba primero sus créditos o incidentes. Para recuperación más detallada, usa la guía de fallos.

Límites para desarrolladores y providers

Para desarrolladores, la división crítica es consumer access frente a API contract. Gemini chat ayuda a entender el comportamiento del prompt, pero el código de producción debe usar el model path documentado para la ruta que pruebas. La documentación de Google AI separa Nano Banana 2, Nano Banana Pro y la Nano Banana original, por lo que el model ID pertenece a la sección de desarrollo, no al arranque para usuarios generales.

Un provider API puede ser útil para batching, billing layer común o gateway entre modelos. También añade otro responsable entre tu código y el modelo de Google. Antes de adoptarlo, revisa qué modelo afirma llamar, cómo retiene imágenes de entrada, cómo describe output rights, cómo devuelve errores y si las claims de precio o créditos tienen fecha.

Si lo principal es precio, cuota o acceso gratuito, consulta la versión inglesa de pricing and quota guide cuando no exista una versión local. Para video, usa la ruta de imagen a video. Para alternativas locales, mira la opción con ComfyUI.

Preguntas frecuentes

¿Nano Banana puede editar una imagen existente?

Sí. La pregunta práctica es qué ruta debe hacerlo. Gemini sirve para el flujo oficial de consumidor, Search o Lens para tareas móviles, AI Studio/API para trabajo controlado y un editor de terceros requiere revisar créditos, retención, derechos y dueño de la ruta.

¿Editar con Nano Banana es gratis?

No hay una sola respuesta. Consumer access, paid plan capacity, API billing, provider credits y trials de editores de terceros son contratos distintos. Si el coste importa, revisa las condiciones actuales de la ruta, no números antiguos de uso diario.

¿Inpainting es lo mismo que edición con Nano Banana?

No. Inpainting es una tarea: cambiar o rellenar una parte de la imagen. La edición con Nano Banana también incluye cambio de fondo, style transfer, combinación de referencias, product mockups, outpainting, eliminación de objetos y refinement con prompts.

¿Qué prompt funciona mejor?

Un preserve-first prompt: define la zona editable, enumera identidad, pose, luz, texto, logo y composición que deben mantenerse, describe el cambio, añade constraints y fija un criterio de fallo. La ruta sigue importando; ningún prompt convierte un wrapper público en entorno seguro para activos confidenciales.

¿Cuándo debo dejar de intentarlo?

Cuando haya identity drift repetido, daño de texto o logo, pérdida de calidad, riesgo de subida, derechos inciertos o route mismatch. Cambiar a una ruta controlada, otro endpoint o un editor tradicional suele ser mejor que añadir más sinónimos.

Etiquetas

Compartir este artículo

XTelegram