Para generar una imagen 4K con GPT Image 2 desde la API, define el parámetro size como 3840x2160 para horizontal o 2160x3840 para vertical. Esos valores son el punto de partida operativo; pedir “4K” dentro del prompt no garantiza los píxeles del archivo final.
Después guarda la imagen devuelta en base64 y mide el ancho y alto reales. Una respuesta correcta de la API no basta si el CMS, el optimizador, el CDN o el frontend sustituyen el original por una versión más pequeña.
Usa Image API cuando la tarea sea generar o editar una imagen directa. Usa Responses API cuando la imagen forme parte de un chat, un agente o una cadena de herramientas. En ambos casos, cualquier salida por encima de 2560x1440 debe tratarse como experimental y verificarse antes de publicarla.
| Objetivo | Primer ajuste | Por qué | Cuándo parar |
|---|---|---|---|
| 4K horizontal | size: "3840x2160" | formato 16:9 fácil de validar | el archivo guardado no mide 3840x2160 |
| 4K vertical | size: "2160x3840" | útil para pósteres y mobile | el recorte posterior rompe la composición |
| Aplicación multi-step | Responses API image tool | encaja en chat, agent o tool flow | no queda archivo medible |
| Máxima calidad visual | master 2K y upscale | permite elegir mejor composición | el upscale deforma texto o detalles |
No trates la palabra 4K dentro del prompt como control técnico. El control empieza con size y termina cuando el archivo guardado se puede medir.
size es el control real de resolución
El prompt controla la intención visual: producto, fondo, texto, estilo, composición y tono. No debe ser el único lugar donde declares la resolución. Si el request no tiene un size válido, tu pipeline no puede prometer un archivo 4K aunque el resultado se vea nítido.
Empieza con un caso pequeño y repetible: un prompt estable, un size, un nivel de calidad y una operación de guardado. Cuando eso funcione, añade imágenes de referencia, edición, compresión, subida al CMS y variantes locales. Si pruebas todo a la vez, cada fallo será más caro de diagnosticar.
Convertir size en contrato también ayuda a coordinar equipos. Contenido sabe qué canvas espera, ingeniería puede validar antes de llamar a la API y diseño puede comprobar que ningún paso posterior recortó zonas importantes.
hljs jsconst result = await client.images.generate({
model: "gpt-image-2",
prompt: "A clean product hero image with precise Spanish headline text.",
size: "3840x2160",
quality: "high"
});

Dimensiones 4K válidas y custom sizes
Un custom size válido debe respetar varias reglas: ningún borde puede superar 3840 px, ancho y alto deben ser múltiplos de 16, la relación entre lado largo y lado corto no debe pasar de 3:1, y el total de píxeles debe quedar dentro del rango permitido.
3840x2160 y 2160x3840 son los dos tamaños más claros para validar 4K en landscape y portrait. 4096x2160 aparece a menudo en conversaciones sobre 4K, pero supera el borde máximo de 3840 y no debe ser el primer request directo.
Valida antes de llamar a la API. Un error local claro ahorra coste y tiempo de cola. El mensaje debe decir si falló el edge limit, el múltiplo de 16, la proporción o el total de píxeles. Así nadie intentará arreglar con prompt lo que es un problema de dimensiones.
hljs jsfunction isValidImageSize(width, height) {
const pixels = width * height;
const longEdge = Math.max(width, height);
const shortEdge = Math.min(width, height);
return longEdge <= 3840 && width % 16 === 0 && height % 16 === 0 &&
longEdge / shortEdge <= 3 && pixels >= 655360 && pixels <= 8294400;
}
| Case | Use it? | Why | Check |
|---|---|---|---|
| 3840x2160 | yes | standard landscape 4K | verify decoded width and height |
| 2160x3840 | yes | portrait 4K within the same edge limit | confirm downstream crop rules |
| 4096x2160 | no | the long edge exceeds 3840 | use a valid 3840-edge size or upscale |
| 3840x1200 | depends | must satisfy aspect and total-pixel rules | check 3:1 ratio and pixel floor |
Image API para generación 4K directa
Si solo necesitas una imagen desde un request, Image API es el camino más corto. Define model, prompt, size, quality y formato; luego guarda la salida base64. Esta ruta deja menos capas ocultas y facilita repetir la prueba.
En producción guarda logs con modelo, size, quality, output format, ruta de archivo, píxeles reales, latencia y error. Con esos datos puedes separar un problema de resolución, un problema de calidad y un problema del sistema de entrega.
No empieces con todos los casos complejos. Primero demuestra que el request 4K se guarda y se mide. Después añade edición, referencia visual, textos largos, variaciones de idioma y procesamiento por lotes.
hljs jsimport fs from "node:fs";
const image = result.data[0];
fs.writeFileSync("gpt-image-2-4k.png", Buffer.from(image.b64_json, "base64"));

Responses API para workflows con varias herramientas
Responses API tiene sentido cuando la imagen forma parte de una aplicación más amplia. Un usuario describe un producto, el modelo organiza el brief, se genera una imagen hero y después se devuelven notas para publicación. En ese caso la generación de imagen es una herramienta dentro de un flujo.
El tool call de imagen sigue necesitando un size explícito. No basta con que el paso de texto diga que quiere una imagen 4K. El parámetro debe viajar hasta la herramienta y el resultado debe guardarse y medirse igual que en Image API.
Separa los errores por capa. Puede fallar el brief, la herramienta de imagen, el guardado, el CDN o el render del navegador. Si todo queda como un único generation failed, acabarás cambiando el modelo cuando quizá solo había un optimizador reduciendo el archivo.
hljs jsconst response = await client.responses.create({
model: "gpt-5.4",
input: "Create a launch poster and return production notes.",
tools: [{ type: "image_generation", model: "gpt-image-2", size: "3840x2160" }]
});
Calidad, formato y fondo transparente
Elige quality según la fase. Low o medium sirven para explorar composición; high tiene sentido para el candidato final. High puede aumentar coste y latencia, así que no lo uses para ocultar una mala validación de tamaño.
PNG es útil para postproducción y revisión de texto. JPEG o WebP pueden ser mejores para entrega web si el peso importa. Después de comprimir, revisa texto pequeño, líneas finas, logotipos y mockups de interfaz, no solo el número de píxeles.
GPT Image 2 no debe planificarse como una ruta directa para fondo transparente. Si necesitas transparent PNG, añade un paso posterior de máscara, segmentación, background removal o diseño manual. La generación 4K y la transparencia son decisiones separadas.
El coste tampoco se resume en una cifra universal para 4K. Influyen image input, image output, text input, quality, edición, reintentos y batch. Para una estimación real, combina la tarifa oficial vigente con un smoke test pequeño en tu cuenta.
4K nativo o master 2K con upscale
El 4K nativo encaja cuando el tamaño final es parte del requisito: banner grande, póster, hero de producto, vista previa de impresión o asset que diseño consumirá sin escalar. Es una ruta simple, pero cada variante fallida cuesta más.
Un master 2K con upscale encaja cuando la composición, el texto o los detalles todavía no están cerrados. Puedes generar varias opciones con menor coste, elegir la más estable y escalar solo la candidata final.
La decisión depende del riesgo principal. Si el riesgo es quedarse corto de píxeles, genera 4K nativo. Si el riesgo es repetir composición y texto, explora en 2K. Si el riesgo es presupuesto, separa exploration y final render con límites distintos.
| Production need | First route | Reason | Stop rule |
|---|---|---|---|
| Direct 4K file from one request | Image API | one generation call controls size directly | stop if decoded file is not requested size |
| Agent or multi-step app | Responses API image tool | image generation can sit beside text and tools | stop if tool result is not saved and measured |
| Large format from best-looking draft | 2K master plus upscale | often more controllable for text and fine detail | stop if upscaler changes text or layout |
| Unclear access or billing | small smoke test | org verification and cost vary by account | stop before batch spending |
Verifica el archivo guardado
Una respuesta exitosa no equivale a un asset final. Comprueba que el archivo existe, que se puede leer, que ancho y alto coinciden con el request, que el formato es el esperado y que la copia pública no fue reducida por un sistema posterior.
Guarda metadata junto al asset: requested size, actual width, actual height, format, file size, quality, prompt hash y ruta pública. Esa trazabilidad ayuda cuando generas imágenes localizadas, OG images, social cards o versiones comprimidas.
Si el tamaño no coincide, mira el request y el pipeline antes de tocar el prompt. Revisa la cadena size, las reglas de custom size, el acceso del modelo, organization verification, la ruta de guardado, el optimizador de imagen y el srcset del frontend.

Cómo diagnosticar fallos de tamaño o generación
Un invalid size suele venir de una regla de dimensiones. Registra width, height, edge, ratio y total de píxeles antes de llamar a la API. El mensaje de error debe decir cuál de esas reglas falló.
Un access error puede depender de la organización o del modelo disponible para esa cuenta. Antes de comparar calidad o coste, ejecuta un smoke test pequeño con la misma organización y la misma API key que usará producción.
Si la generación fue correcta pero la imagen final se ve pequeña, busca conversiones posteriores. Mide el original, el archivo subido, la URL pública y la variante que carga el navegador. Muchas reducciones ocurren después de la API.
FAQ
¿Basta con escribir 4K en el prompt?
No. El prompt expresa intención, pero los píxeles los controla size. Después hay que guardar y medir el archivo.
¿Qué tamaño conviene probar primero?
3840x2160 para horizontal y 2160x3840 para vertical. Usa custom sizes solo si cumplen las reglas de borde, múltiplo, ratio y píxeles.
¿Por qué no usar 4096x2160?
Porque el borde largo supera 3840. Usa un tamaño válido de borde 3840 o genera primero y aplica upscale después.
¿Image API o Responses API?
Image API es más simple para generación directa. Responses API encaja cuando la imagen es parte de chat, agent o tool workflow.
¿GPT Image 2 genera fondo transparente?
No lo planifiques como salida transparente directa. Añade background removal, máscara o postproducción si necesitas PNG transparente.
¿Qué hago si el 4K nativo falla?
Revisa size, acceso, archivo guardado y transformaciones posteriores. Si sigue fallando, crea un master 2K estable y escala la candidata final.



