AI Tools

Límites de generación de imágenes en Gemini: Apps, API y error 429

Distingue entre límites diarios de Gemini Apps, cuotas del proyecto en Gemini API y el camino de Vertex AI, con pasos concretos para revisar la cuota activa y responder a 429 RESOURCE_EXHAUSTED.

YingTu Editorial
YingTu Editorial
YingTu Editorial
3 may 2026
Límites de generación de imágenes en Gemini: Apps, API y error 429
yingtu.ai

Contenido

No se detectaron encabezados

La generación de imágenes en Gemini no se rige por un solo número. El mensaje de límite puede venir de Gemini Apps, de un proyecto que usa Gemini API en Google AI Studio o de una carga ejecutada por Vertex AI.

La primera pregunta no es cuántas imágenes permite Gemini, sino qué superficie está controlando la solicitud. Gemini Apps usa límites diarios por plan. Gemini API usa cuota por proyecto, modelo y nivel, visible en AI Studio. Vertex AI pertenece al entorno de Google Cloud, con proyecto, región, IAM, facturación, gobierno y cuotas propias.

Qué límite de Gemini estás tocando

Una misma duda sobre límites de imágenes puede referirse a tres sistemas distintos. Quien usa la app de Gemini quiere saber si llegó al cupo diario del plan. Quien llama a la API necesita mirar el proyecto, el modelo y la métrica de cuota. Quien usa Vertex AI debe revisar Cloud Console, región, permisos y proceso de aumento de cuota.

SuperficieQué controla el límiteDónde verificarPrimer paso seguro
Gemini AppsGeneración, edición y reintentos de imágenes dentro del plan de consumoGoogle Help de Gemini Apps y avisos dentro del productoEsperar el reinicio diario, reducir repeticiones y revisar el plan.
Gemini API / Google AI StudioCuota del proyecto por modelo, nivel y dimensiones como RPM, TPM, RPD e IPMDocumentación de Gemini API y pantalla activa de cuotas en AI StudioIdentificar proyecto y modelo; luego limitar, poner cola, habilitar facturación o pedir aumento.
Vertex AIProyecto Cloud, región, IAM, registros, facturación, seguridad y cuotasCloud Console y documentación de Vertex AIUsar cuando la operación debe pertenecer a Google Cloud.

Esta separación evita diagnósticos falsos. El cupo diario de Gemini Apps no es la cuota del proyecto Gemini API. Un proyecto API puede devolver 429 RESOURCE_EXHAUSTED mientras la app de Gemini todavía genera imágenes. También puede ocurrir lo contrario: la app llega al límite diario, pero la cuota API sigue disponible. Crear varias claves dentro del mismo proyecto tampoco multiplica la cuota.

Límites diarios en Gemini Apps

Límites diarios de Gemini Apps frente a cuotas de proyecto de Gemini API

Para Gemini Apps, la referencia correcta es la ayuda de Google sobre límites y actualizaciones de las aplicaciones de Gemini. Al 3 de mayo de 2026, esa página muestra límites diarios para generación y edición con Nano Banana 2, y para reintentos con Nano Banana Pro, divididos por Basic, Google AI Plus, Google AI Pro y Google AI Ultra. También advierte que la demanda de imágenes es alta, que los límites pueden cambiar con frecuencia y que se reinician diariamente.

Función de imagen en Gemini AppsBasicGoogle AI PlusGoogle AI ProGoogle AI Ultra
Generación y edición con Nano Banana 2Hasta 20 imágenes al díaHasta 50 imágenes al díaHasta 100 imágenes al díaHasta 1000 imágenes al día
Reintentos con Nano Banana ProNo disponibleHasta 50 imágenes al díaHasta 100 imágenes al díaHasta 1000 imágenes al día

Estos números explican Gemini Apps, no la API. Si la app dice que ya no puedes crear más imágenes hoy, normalmente debes esperar el reinicio, reducir el número de reintentos, confirmar si la función está incluida en tu plan o cambiar de plan solo si ese cupo es realmente el cuello de botella.

No conviene usar la documentación de API para justificar un límite de la app. Tampoco conviene rotar claves o migrar a Vertex AI por un problema que vive en la interfaz de consumo. La reparación correcta debe seguir al dueño del límite.

La cuota de imagen de Gemini API vive en AI Studio

En Gemini Developer API, el número activo depende del proyecto, del modelo y del nivel. La documentación de Google indica que los límites se aplican por proyecto, no por clave API. También separa dimensiones como requests per minute, tokens per minute, requests per day e images per minute para cargas capaces de generar imágenes.

La comprobación práctica empieza en Google AI Studio. Selecciona el proyecto que posee la clave, confirma el modelo que llama el código y revisa la cuota activa para ese modelo. Si usas un modelo preview de imagen, trata la capacidad como más variable que la de una fila estable.

Síntoma en APICuota probableQué hacer
Muchos pedidos pequeños fallan en pocos segundosRPM o capacidad temporalBajar concurrencia, usar cola, backoff exponencial y jitter.
Falla más con prompts largos o entradas multimodales pesadasTPM o tamaño de solicitudReducir entrada, dividir tareas y cachear contexto repetido.
Funciona durante parte del día y luego se agotaRPDPresupuesto diario, prioridad de tareas y preparación de aumento de cuota.
El texto funciona pero las imágenes fallanIPM o capacidad del modelo de imagenCola separada para imágenes, menor paralelismo y estado de espera visible.

Varias claves API dentro de un mismo proyecto comparten el mismo pool. La solución de producción no es cambiar de clave, sino controlar la carga: cola, limitador, caché, tareas idempotentes, registros estructurados y solicitudes de aumento cuando el volumen real lo justifica.

Precio, acceso al modelo y cuota no son lo mismo

Tres preguntas suelen mezclarse: si el modelo puede generar imágenes, si está disponible en un nivel gratuito o pagado, y qué velocidad tiene tu proyecto. Cada respuesta viene de una fuente distinta. La página de pricing cubre precio y elegibilidad. La documentación de image generation cubre cómo llamar al modelo. La documentación de rate limits y AI Studio cubren la cuota activa.

Al 3 de mayo de 2026, Google muestra gemini-3-pro-image-preview como paid-only en la tabla para desarrolladores. Ese dato define acceso y facturación, pero no indica una cuota universal de RPM o IPM. Tampoco convierte todo 429 en un problema de pago. Un 429 puede ser un pico, una cuota diaria, una métrica de imagen o capacidad temporal.

Antes de lanzar una integración, revisa el modelo exacto llamado por el código, la superficie donde lo usas, su estado gratuito o pagado, el proyecto dueño de la clave, las cuotas RPM/TPM/RPD/IPM en AI Studio y los detalles de error como retryDelay, quota metric y request id. Ese orden evita aplicar la corrección equivocada.

Qué hacer cuando Gemini dice que alcanzaste el límite

Árbol de acciones cuando Gemini alcanza un límite de imagen

Si el aviso aparece en Gemini Apps, probablemente agotaste el cupo diario del plan para crear, editar o rehacer imágenes. Espera el reinicio, reduce reintentos repetidos y revisa si la función pertenece a tu plan. La pantalla de cuotas de API no cambia ese límite de consumo.

Si el aviso viene de código, logs o una respuesta API, abre AI Studio. Identifica proyecto, modelo y métrica. Un pico corto pide limitador y cola. Una entrada enorme pide reducir tokens o dividir trabajo. Una cuota diaria agotada pide presupuesto y priorización. Un cuello de botella de imagen pide cola separada y menor concurrencia.

Para tráfico real, diseña la generación como trabajo en cola. El usuario debe ver un estado de espera claro. El backend debe controlar concurrencia, reintentos, idempotencia y estado final. Los logs deben guardar proyecto, modelo, quota metric, request id y número de reintentos para que el aumento de cuota tenga evidencia.

Si la respuesta ya es 429 RESOURCE_EXHAUSTED, respeta retryDelay, añade jitter y evita que todos los workers reintenten a la vez. Para patrones de código, logs y escalación, usa el material hermano: Gemini image generation error 429 fix.

Un 429 de API no es el límite diario de la app

Mapa de diagnóstico de Gemini image generation 429

El límite diario de la app es una regla de producto para consumidores. El 429 de API es una respuesta de cuota o capacidad para proyecto, modelo, nivel o métrica. Ambos se sienten como un bloqueo de Gemini, pero piden evidencia distinta.

Antes de cambiar arquitectura, conserva retryDelay, quota metric, proyecto, modelo, estado de facturación, request id y detalles originales del error. RPM, TPM, RPD e IPM se arreglan de manera distinta. Un límite diario no se soluciona con reintentos cada segundo; un pico minuto a minuto no se arregla esperando hasta mañana si el servicio sigue disparando ráfagas.

El error operativo más grande es el retry agresivo. Cuando cada worker vuelve a intentar inmediatamente, la cola amplifica el problema. Un patrón más estable respeta la demora del servidor, usa backoff, limita concurrencia, suspende tareas no esenciales y comunica espera al usuario.

Cuándo tiene sentido usar Vertex AI

Vertex AI no elimina los límites de Gemini. Es una ruta de Google Cloud con proyecto, región, IAM, logging, facturación, seguridad y proceso de cuota propio. Su valor aparece cuando la carga debe ser operada por una organización Cloud, no cuando solo se busca evitar un límite de la app.

Para un prototipo en AI Studio, Vertex AI puede añadir complejidad. Primero mide volumen real, modelo, tasa de error, tamaño de entrada y métrica de cuota en Gemini API. Si después necesitas service accounts, auditoría, control regional, soporte empresarial, facturación unificada o aumento de cuota dentro de Cloud, Vertex AI puede ser el propietario correcto.

La decisión práctica no es qué ruta no tiene límites. La decisión es qué superficie debe poseer el trabajo y qué proceso de cuota puedes operar. Una integración pequeña puede quedarse en Gemini API; una plataforma con gobierno Cloud puede necesitar Vertex AI.

Preguntas frecuentes

¿Cuántas imágenes puede generar Gemini al día?

Gemini Apps tiene límites diarios por plan. Al 3 de mayo de 2026, Google Help muestra límites para Basic, Google AI Plus, Google AI Pro y Google AI Ultra, con la advertencia de que pueden cambiar con frecuencia y se reinician diariamente.

¿Cuál es el límite de generación de imágenes en Gemini API?

No hay un único número público para todos los proyectos. Revisa el proyecto, modelo y nivel en Google AI Studio. La documentación pública explica las dimensiones; el valor activo pertenece a tu proyecto.

¿Cada clave API de Gemini tiene su propia cuota?

No. Los límites de Gemini API se aplican por proyecto. Varias claves dentro del mismo proyecto comparten la misma cuota.

¿La facturación elimina los límites de Gemini?

No. La facturación puede cambiar el nivel, habilitar modelos pagados o permitir una solicitud de aumento, pero siguen existiendo límites de proyecto, modelo, capacidad y seguridad.

¿Nano Banana Pro es gratis para imágenes?

Depende de la superficie. En Gemini Apps es una pregunta de plan y cupo diario. En Gemini API es una pregunta de pricing, acceso al modelo y cuota del proyecto. No traslades una respuesta de app a la API.

¿Cuánto debo esperar después de alcanzar un límite de imagen?

En Gemini Apps, espera el reinicio diario indicado por el producto o Google Help. En API 429, respeta retryDelay si existe y usa backoff. Si agotaste RPD, reintentar cada pocos segundos no ayuda.

¿Se pueden evitar los límites de generación de imágenes?

Las opciones seguras son esperar, reducir ráfagas, usar cola, cachear resultados, elegir la ruta oficial correcta, habilitar facturación donde sea necesaria o pedir aumento de cuota para carga legítima. Rotar claves o reintentar sin control empeora la fiabilidad.

¿Cuándo debo tratarlo como un problema 429?

Cuando la llamada API devuelve 429 RESOURCE_EXHAUSTED, especialmente si trae quota metric, retryDelay o request id. Primero separa Apps, API y Vertex AI; después decide retry, cola, logs y aumento de cuota.

Etiquetas

Compartir este artículo

XTelegram