Límites del Free Tier de Gemini API (2026): cuota, API keys y pago

Gemini API todavía ofrece acceso gratuito para algunas filas de modelo y algunas superficies de API, pero los límites de la capa gratuita ya no deberían leerse como una tabla universal que sirve para todos los proyectos. El límite que realmente puede parar tu aplicación pertenece al proyecto que está detrás de la API key, y depende del modelo, usage tier, región, billing state y política vigente de Google.

Comprobado el 16 de julio de 2026, el camino práctico es este: usa la página de Gemini API pricing para confirmar si el modelo o la función que quieres usar tiene Free Tier. Después abre AI Studio con el proyecto que posee tu key y revisa los RPM, TPM, RPD, reset behavior y usage actuales. Crear más keys dentro del mismo proyecto no crea más cuota gratuita. La key autentica; el proyecto posee la cuota y la frontera de facturación.

Para aprender, validar prompts, montar prototipos pequeños o ejecutar herramientas internas de bajo volumen, la capa gratuita puede seguir siendo suficiente. Para funciones con usuarios reales, datos sensibles, necesidad de throughput predecible, errores 429 recurrentes o modelos paid-only, lo correcto es pasar a un proyecto con billing y controlar el gasto, no intentar estirar una cuota gratuita frágil.

Pregunta	Respuesta actual	Dónde comprobarlo
¿Gemini API sigue siendo gratis?	Algunas filas de modelo y superficie siguen teniendo Free Tier.	Página de precios de Gemini API
¿Cuál es mi límite exacto?	Depende del proyecto, modelo, tier, región y billing state.	Vista de usage o rate limits en AI Studio
¿Cada API key recibe su propia cuota?	No. La key autentica; el proyecto posee la cuota.	Docs de API key y billing
¿Qué pasa al superar la cuota?	Normalmente 429 o `RESOURCE_EXHAUSTED`.	Rate limits y troubleshooting
¿Sirve para producción?	Solo si el riesgo, volumen y sensibilidad son bajos.	Billing, data handling y usage tiers

Qué significa ahora la capa gratuita de Gemini API

La búsqueda "límites capa gratuita Gemini API" mezcla tres decisiones que conviene separar antes de diseñar nada.

La primera decisión es si el modelo o la función sigue siendo gratuita. Esa respuesta pertenece a la página de precios de Google, no a una captura antigua ni a una tabla de una guía de 2025. Dentro de Gemini puede haber una fila con Free Tier, otra fila paid-only y una función preview, image, batch o especializada con condiciones distintas. La pregunta correcta no es solo "¿Gemini es gratis?", sino "¿esta fila de modelo y esta superficie de API son gratis ahora?"

La segunda decisión es cómo se miden los límites. La documentación de Gemini API rate limits usa RPM, TPM y RPD: requests per minute, tokens per minute y requests per day. Esas dimensiones importan, pero la documentación pública no debe leerse como una promesa de que todos los proyectos verán los mismos números para siempre.

La tercera decisión es cuánto puede usar tu proyecto concreto en este momento. Ese dato operativo se comprueba en AI Studio. Si cambian el proyecto, modelo, región, usage tier, billing state o la política de Google, el límite efectivo también puede cambiar. Por eso los números estáticos son contexto, no contrato operativo.

Mapa de fuentes: precios, rate limits, keys y billing

Muchos errores vienen de usar una sola fuente para responder todo. Es mejor asignar cada afirmación a su superficie correcta.

Afirmación que quieres verificar	Mejor fuente	Cómo usarla
Si un modelo o función tiene Free Tier	Gemini API pricing	Busca la fila de modelo y la superficie actual.
Cómo funcionan RPM, TPM y RPD	Gemini API rate limits	Revisa dimensiones, tiers y reset behavior.
Qué proyecto está detrás de la key	Gemini API key documentation	Comprueba credential y project context.
Qué cambia al activar billing	Gemini API billing documentation	Mira paid project, data handling, spend caps y créditos excluidos.
Por qué falló una llamada	Gemini API troubleshooting	Distingue quota exhaustion de billing, región o modelo no disponible.

La página de precios responde qué filas son gratis. La página de rate limits explica las dimensiones. AI Studio muestra el estado vivo de tu proyecto. La documentación de billing aclara cuándo pagar, cómo cambian los términos y qué créditos no aplican. La API key no sustituye ninguna de esas superficies.

Si solo recuerdas una frase, que sea esta: el estado gratuito del modelo, la cuota real del proyecto y el billing state se verifican por separado.

Una API key no es una bolsa de cuota

Una API key es una credencial. Identifica y autentica la llamada, pero no crea una quota pool independiente. Si Key A y Key B se crearon dentro del mismo proyecto, consumen los mismos límites de proyecto. Key C puede ayudarte a rotar credenciales o separar entornos, pero no aumenta el Free Tier.

Esto cambia el diagnóstico de errores. Si tu aplicación recibe 429, no empieces creando más keys en el mismo proyecto. Primero identifica qué proyecto está detrás de la key y qué límites ve ese proyecto en AI Studio. Si miras otro proyecto, compararás números equivocados. Si rotas keys sin cambiar el proyecto ni la carga, probablemente repetirás el mismo fallo.

Antes de comparar límites, comprueba lo siguiente:

Revisión	Por qué importa
Qué cuenta de Google creó la key	Define quién puede gestionar el proyecto.
Qué Google Cloud project está detrás	La cuota, billing y usage reports viven ahí.
Si billing está activado	Puede cambiar tier, data handling y modelos disponibles.
Qué model ID llama tu código	Cada fila puede tener estado gratuito distinto.
Si AI Studio muestra el mismo proyecto	Otra vista puede dar el límite equivocado.

No mezcles el diagnóstico de cuota con la migración de autenticación. La documentación actual de API keys dice que AI Studio ya crea nuevas auth keys por defecto y que las solicitudes con standard keys se rechazarán en septiembre de 2026. Comprueba el tipo de las keys existentes y migra antes del plazo. El cambio mantiene la autenticación; no crea una cuota ni una cuenta de billing independiente para la key.

No intentes eludir límites creando keys adicionales. Ajusta la carga, confirma el proyecto, cambia la arquitectura o activa billing cuando necesites más capacidad.

Cuándo la capa gratuita encaja y cuándo conviene pagar

La capa gratuita funciona mejor como carril de desarrollo. Es útil para aprender la API, comparar prompts, validar un prototipo pequeño, probar con datos sintéticos o ejecutar una herramienta interna de baja frecuencia. No es una garantía de producción.

El nombre de la familia no basta para decidir si algo es gratis. La captura oficial de pricing del 16 de julio muestra contratos distintos incluso dentro de Gemini 3:

Ejemplo de fila	Free Tier en Standard	Qué demuestra
Gemini 3.5 Flash	Sí	Input y output de Standard siguen gratis dentro de los live project limits.
Gemini 3.1 Flash-Lite	Sí	La fila ligera orientada a texto mantiene Free Tier.
Gemini 3.1 Pro Preview	No	Que el nombre diga Gemini 3.1 no garantiza acceso gratis.
Gemini 3.1 Flash Image / Flash Lite Image	No	Image generation puede ser paid-only aunque una fila de texto de la familia sea gratis.

Es un ejemplo fechado para aprender a leer la página, no una tabla permanente de derechos. Antes de desplegar, vuelve a comprobar el model ID exacto, la execution lane y el límite del mismo proyecto en AI Studio.

Carga de trabajo	Encaje con Free Tier	Encaje con proyecto de pago
Aprender la API	Buen encaje	Normalmente innecesario
Prototipo pequeño con datos sintéticos	Buen encaje si el uso es bajo	Útil para probar throughput realista
Demo interna	Aceptable si puede fallar	Mejor si la demo importa
Función para clientes	Riesgoso	Suele ser la ruta correcta
Datos sensibles, regulados o propietarios	Evítalo por defecto	Revisa paid data terms
Batch de alto volumen	Mal encaje	Usa paid tier o una ruta batch adecuada
Modelo o función paid-only	No disponible	Requerido

También conviene revisar el presupuesto. La documentación actual de billing indica que los nuevos Google Cloud free-trial credits creados después de marzo de 2026 no aplican a Gemini API o AI Studio. No diseñes un plan "gratis" con créditos genéricos de Cloud sin confirmar la página actual.

Al activar billing, AI Studio asigna Prepay o Postpay. Para una cuenta Prepay nueva, la compra mínima actual es de USD 10; si el saldo llega a cero, los proyectos Gemini API asociados se detienen y no vuelven automáticamente al Free Tier. En production hay que vigilar el tipo de plan, el saldo, auto-reload y las alertas de presupuesto, no solo que billing esté activo.

Cambiar a pago no es una derrota; es reconocer la frontera operativa. Si la capa gratuita alcanza para una prueba pequeña, úsala. Si usuarios dependen del resultado, los datos son sensibles, el modelo requerido no es gratuito o aparecen 429 durante uso normal, activa billing y monitoriza el gasto.

Cómo comprobar tu límite real en AI Studio

La acción es corta, pero debe hacerse sobre el proyecto correcto.

Abre AI Studio con la cuenta que gestiona la API key.
Selecciona el proyecto que usa tu aplicación.
Abre la vista de usage o rate limits.
Confirma el model ID que llama tu código.
Registra RPM, TPM, RPD, reset behavior, usage tier y billing state.
Repite la comprobación antes de lanzamientos, demos, migraciones y cambios de tráfico.

Si comparas varias keys, compáralas por proyecto. Dos keys del mismo proyecto comparten el mismo propietario de cuota. Dos proyectos distintos pueden mostrar límites distintos incluso si llaman al mismo modelo.

Para profundizar en RPM, TPM y RPD, consulta la guía de rate limits de Gemini API. La versión corta basta para tomar decisiones: si se agota una de las tres dimensiones, la llamada puede fallar aunque las otras parezcan disponibles.

Qué hacer después de 429 o RESOURCE_EXHAUSTED

Un 429 no demuestra que el Free Tier haya desaparecido. Normalmente significa que se agotó una dimensión de cuota, se está revisando el proyecto equivocado, el model ID no coincide, la fila del modelo requiere pago, hay una restricción regional o la lógica de retry empeora el throttling.

Paso	Acción	Motivo
1	Revisa AI Studio para el proyecto detrás de la key	Primero necesitas el verdadero propietario de cuota.
2	Confirma model ID y API surface	Una ruta paid-only no se arregla esperando.
3	Mira RPM, TPM y RPD por separado	La dimensión agotada decide la solución.
4	Reduce concurrencia y usa backoff con jitter	Reintentar demasiado rápido empeora el límite.
5	Acorta prompts y cachea respuestas repetidas	Baja requests y tokens al mismo tiempo.
6	Activa billing si el tráfico normal toca el techo	La capacidad de producción no debe depender de una cuota gratuita frágil.

Si el error menciona billing, region, unsupported model o failed precondition, esperar al reset puede no bastar. En paid tier, un spend-based rate limit evaluado en una ventana móvil de 10 minutos también puede devolver 429: reduce el ritmo de solicitudes costosas, espera la ventana corta o solicita más límite. Usa troubleshooting para separar agotamiento de cuota, spend limit y problemas de configuración.

Diseño que sobrevive a cambios de cuota

Usa la capa gratuita para medir, no para prometer. Durante el desarrollo registra request count, prompt size, token usage, latency, retry count y failure rate. Así sabrás si tu carga real cabe en Free Tier sin depender de una tabla antigua.

Mantén model routing. Clasificación simple, extracción y respuestas cortas pueden ir a una ruta más ligera; razonamiento complejo, contexto largo y análisis de código deberían reservarse para un modelo más capaz. No es una forma de eludir límites, sino de gastar la cuota donde tiene más valor.

Cachea lo que pueda repetirse. FAQ bots, clasificadores, routing helpers y asistentes internos suelen repetir patrones. Un cache simple puede reducir RPM y TPM.

Registra errores por dimensión. Daily quota, token throughput y per-minute concurrency requieren fixes distintos. Un log que solo diga "Gemini failed" no ayuda a decidir.

Planifica la ruta pagada antes de necesitarla. Define qué proyecto tendrá billing, quién es budget owner, qué alertas usarás, qué datos pueden enviarse y qué umbral obliga a migrar.

Errores comunes

No lo llames "límite de la API key gratis". La forma correcta es project quota.

No copies tablas antiguas de RPM/RPD en requisitos de producción. Una tabla puede orientar, pero el número operativo debe venir de AI Studio.

No uses límites de la app Gemini como hechos de Gemini API. Consumer app, AI Studio, Gemini API y Vertex AI pueden tener contratos distintos.

No asumas que Google Cloud promotional credits cubren Gemini API. Comprueba la billing page antes de presupuestar.

No uses la capa gratuita para datos sensibles solo porque no cuesta dinero. Customer data, secretos de negocio, contenido regulado o cualquier dato que el usuario no esperaría ver usado para mejora de producto debe revisarse contra paid data terms.

Regla de decisión

Quédate en Free Tier si la carga es baja, no sensible, fácil de reintentar y sigue dentro de los live limits del proyecto en AI Studio.

Pasa a un proyecto con billing si el uso normal produce 429, necesitas throughput predecible, el modelo o función requerida no es gratis, importan privacy/compliance o un cambio de cuota causaría un fallo real para usuarios.

La capa gratuita sigue siendo útil, pero no es un derecho de producción. Trátala como un límite vivo de proyecto que se revisa, mide y confirma de nuevo.

Preguntas frecuentes

¿La capa gratuita de Gemini API todavía existe?

Sí. Algunas filas de modelo y superficies de Gemini API todavía tienen Free Tier. La disponibilidad exacta debe confirmarse en la página actual de precios de Google.

¿Dónde veo mis límites exactos de Gemini API gratis?

En AI Studio, dentro del proyecto que posee tu API key. Esa vista muestra live RPM, TPM, RPD, usage, reset behavior y billing state.

¿Cada Gemini API key recibe su propia cuota gratuita?

No. La key autentica llamadas. La cuota y billing pertenecen al Google Cloud project. Varias keys del mismo proyecto comparten los mismos límites.

¿Puedo aumentar la cuota creando más keys?

No. Más keys en el mismo proyecto sirven para rotación y separación de entornos, no para multiplicar cuota. Para más capacidad, reduce carga, cambia arquitectura o activa billing.

¿Debo migrar mi Gemini API key en 2026?

Puede que sí. Google crea nuevas auth keys por defecto y prevé rechazar las standard keys en septiembre de 2026. Comprueba el tipo en AI Studio y completa la migración oficial antes del plazo. Migrar la autenticación no aumenta la project quota.

¿Qué significa 429 o RESOURCE_EXHAUSTED?

Normalmente una dimensión de rate limit se agotó. Revisa AI Studio para el mismo proyecto, confirma model ID, identifica si falló RPM, TPM o RPD, y decide si esperar, reducir, cachear o pagar.

¿Gemini 3 o Gemini 3.1 son gratis en la API?

No respondas desde memoria ni por apodos. Mira la Gemini API pricing page actual para la fila exacta de modelo y superficie. Algunas previews o funciones nuevas pueden ser paid-only.

¿Puedo usar Free Tier en producción?

Solo para workloads de bajo riesgo, bajo volumen, no sensibles y con tolerancia a fallos. Customer-facing, sensitive, high-volume o reliability-sensitive workloads deberían usar un proyecto con billing.

¿Los créditos de prueba de Google Cloud cubren Gemini API?

La billing page actual dice que los nuevos Google Cloud free-trial credits después de marzo de 2026 no aplican a Gemini API o AI Studio. Verifica la página antes de hacer supuestos de presupuesto.

¿La calidad del modelo cambia entre gratis y pago?

La diferencia clave suele estar en quota, feature access, data handling y predictibilidad operativa, no en una calidad artificialmente reducida. Comprueba el modelo y tier concretos en pricing y billing docs.

¿Qué debo registrar antes de depender del Free Tier?

Project ID, model ID, usage tier, live RPM/TPM/RPD desde AI Studio, reset behavior, billing state y fecha de revisión. Repite la comprobación antes de release, demo, migration y cambios de tráfico.