Gemini API todavía ofrece acceso gratuito para algunas filas de modelo y algunas superficies de API, pero los límites de la capa gratuita ya no deberían leerse como una tabla universal que sirve para todos los proyectos. El límite que realmente puede parar tu aplicación pertenece al proyecto que está detrás de la API key, y depende del modelo, usage tier, región, billing state y política vigente de Google.
Comprobado el 25 de abril de 2026, el camino práctico es este: usa la página de Gemini API pricing para confirmar si el modelo o la función que quieres usar tiene Free Tier. Después abre AI Studio con el proyecto que posee tu key y revisa los RPM, TPM, RPD, reset behavior y usage actuales. Crear más keys dentro del mismo proyecto no crea más cuota gratuita. La key autentica; el proyecto posee la cuota y la frontera de facturación.
Para aprender, validar prompts, montar prototipos pequeños o ejecutar herramientas internas de bajo volumen, la capa gratuita puede seguir siendo suficiente. Para funciones con usuarios reales, datos sensibles, necesidad de throughput predecible, errores 429 recurrentes o modelos paid-only, lo correcto es pasar a un proyecto con billing y controlar el gasto, no intentar estirar una cuota gratuita frágil.
| Pregunta | Respuesta actual | Dónde comprobarlo |
|---|---|---|
| ¿Gemini API sigue siendo gratis? | Algunas filas de modelo y superficie siguen teniendo Free Tier. | Página de precios de Gemini API |
| ¿Cuál es mi límite exacto? | Depende del proyecto, modelo, tier, región y billing state. | Vista de usage o rate limits en AI Studio |
| ¿Cada API key recibe su propia cuota? | No. La key autentica; el proyecto posee la cuota. | Docs de API key y billing |
| ¿Qué pasa al superar la cuota? | Normalmente 429 o RESOURCE_EXHAUSTED. | Rate limits y troubleshooting |
| ¿Sirve para producción? | Solo si el riesgo, volumen y sensibilidad son bajos. | Billing, data handling y usage tiers |
Qué significa ahora la capa gratuita de Gemini API
La búsqueda "límites capa gratuita Gemini API" mezcla tres decisiones que conviene separar antes de diseñar nada.
La primera decisión es si el modelo o la función sigue siendo gratuita. Esa respuesta pertenece a la página de precios de Google, no a una captura antigua ni a una tabla de una guía de 2025. Dentro de Gemini puede haber una fila con Free Tier, otra fila paid-only y una función preview, image, batch o especializada con condiciones distintas. La pregunta correcta no es solo "¿Gemini es gratis?", sino "¿esta fila de modelo y esta superficie de API son gratis ahora?"
La segunda decisión es cómo se miden los límites. La documentación de Gemini API rate limits usa RPM, TPM y RPD: requests per minute, tokens per minute y requests per day. Esas dimensiones importan, pero la documentación pública no debe leerse como una promesa de que todos los proyectos verán los mismos números para siempre.
La tercera decisión es cuánto puede usar tu proyecto concreto en este momento. Ese dato operativo se comprueba en AI Studio. Si cambian el proyecto, modelo, región, usage tier, billing state o la política de Google, el límite efectivo también puede cambiar. Por eso los números estáticos son contexto, no contrato operativo.
Mapa de fuentes: precios, rate limits, keys y billing
Muchos errores vienen de usar una sola fuente para responder todo. Es mejor asignar cada afirmación a su superficie correcta.
| Afirmación que quieres verificar | Mejor fuente | Cómo usarla |
|---|---|---|
| Si un modelo o función tiene Free Tier | Gemini API pricing | Busca la fila de modelo y la superficie actual. |
| Cómo funcionan RPM, TPM y RPD | Gemini API rate limits | Revisa dimensiones, tiers y reset behavior. |
| Qué proyecto está detrás de la key | Gemini API key documentation | Comprueba credential y project context. |
| Qué cambia al activar billing | Gemini API billing documentation | Mira paid project, data handling, spend caps y créditos excluidos. |
| Por qué falló una llamada | Gemini API troubleshooting | Distingue quota exhaustion de billing, región o modelo no disponible. |
La página de precios responde qué filas son gratis. La página de rate limits explica las dimensiones. AI Studio muestra el estado vivo de tu proyecto. La documentación de billing aclara cuándo pagar, cómo cambian los términos y qué créditos no aplican. La API key no sustituye ninguna de esas superficies.
Si solo recuerdas una frase, que sea esta: el estado gratuito del modelo, la cuota real del proyecto y el billing state se verifican por separado.
Una API key no es una bolsa de cuota

Una API key es una credencial. Identifica y autentica la llamada, pero no crea una quota pool independiente. Si Key A y Key B se crearon dentro del mismo proyecto, consumen los mismos límites de proyecto. Key C puede ayudarte a rotar credenciales o separar entornos, pero no aumenta el Free Tier.
Esto cambia el diagnóstico de errores. Si tu aplicación recibe 429, no empieces creando más keys en el mismo proyecto. Primero identifica qué proyecto está detrás de la key y qué límites ve ese proyecto en AI Studio. Si miras otro proyecto, compararás números equivocados. Si rotas keys sin cambiar el proyecto ni la carga, probablemente repetirás el mismo fallo.
Antes de comparar límites, comprueba lo siguiente:
| Revisión | Por qué importa |
|---|---|
| Qué cuenta de Google creó la key | Define quién puede gestionar el proyecto. |
| Qué Google Cloud project está detrás | La cuota, billing y usage reports viven ahí. |
| Si billing está activado | Puede cambiar tier, data handling y modelos disponibles. |
| Qué model ID llama tu código | Cada fila puede tener estado gratuito distinto. |
| Si AI Studio muestra el mismo proyecto | Otra vista puede dar el límite equivocado. |
No intentes eludir límites creando keys adicionales. Ajusta la carga, confirma el proyecto, cambia la arquitectura o activa billing cuando necesites más capacidad.
Cuándo la capa gratuita encaja y cuándo conviene pagar
La capa gratuita funciona mejor como carril de desarrollo. Es útil para aprender la API, comparar prompts, validar un prototipo pequeño, probar con datos sintéticos o ejecutar una herramienta interna de baja frecuencia. No es una garantía de producción.

| Carga de trabajo | Encaje con Free Tier | Encaje con proyecto de pago |
|---|---|---|
| Aprender la API | Buen encaje | Normalmente innecesario |
| Prototipo pequeño con datos sintéticos | Buen encaje si el uso es bajo | Útil para probar throughput realista |
| Demo interna | Aceptable si puede fallar | Mejor si la demo importa |
| Función para clientes | Riesgoso | Suele ser la ruta correcta |
| Datos sensibles, regulados o propietarios | Evítalo por defecto | Revisa paid data terms |
| Batch de alto volumen | Mal encaje | Usa paid tier o una ruta batch adecuada |
| Modelo o función paid-only | No disponible | Requerido |
También conviene revisar el presupuesto. La documentación actual de billing indica que los nuevos Google Cloud free-trial credits creados después de marzo de 2026 no aplican a Gemini API o AI Studio. No diseñes un plan "gratis" con créditos genéricos de Cloud sin confirmar la página actual.
Cambiar a pago no es una derrota; es reconocer la frontera operativa. Si la capa gratuita alcanza para una prueba pequeña, úsala. Si usuarios dependen del resultado, los datos son sensibles, el modelo requerido no es gratuito o aparecen 429 durante uso normal, activa billing y monitoriza el gasto.
Cómo comprobar tu límite real en AI Studio
La acción es corta, pero debe hacerse sobre el proyecto correcto.
- Abre AI Studio con la cuenta que gestiona la API key.
- Selecciona el proyecto que usa tu aplicación.
- Abre la vista de usage o rate limits.
- Confirma el model ID que llama tu código.
- Registra RPM, TPM, RPD, reset behavior, usage tier y billing state.
- Repite la comprobación antes de lanzamientos, demos, migraciones y cambios de tráfico.
Si comparas varias keys, compáralas por proyecto. Dos keys del mismo proyecto comparten el mismo propietario de cuota. Dos proyectos distintos pueden mostrar límites distintos incluso si llaman al mismo modelo.
Para profundizar en RPM, TPM y RPD, consulta la guía de rate limits de Gemini API. La versión corta basta para tomar decisiones: si se agota una de las tres dimensiones, la llamada puede fallar aunque las otras parezcan disponibles.
Qué hacer después de 429 o RESOURCE_EXHAUSTED
Un 429 no demuestra que el Free Tier haya desaparecido. Normalmente significa que se agotó una dimensión de cuota, se está revisando el proyecto equivocado, el model ID no coincide, la fila del modelo requiere pago, hay una restricción regional o la lógica de retry empeora el throttling.

| Paso | Acción | Motivo |
|---|---|---|
| 1 | Revisa AI Studio para el proyecto detrás de la key | Primero necesitas el verdadero propietario de cuota. |
| 2 | Confirma model ID y API surface | Una ruta paid-only no se arregla esperando. |
| 3 | Mira RPM, TPM y RPD por separado | La dimensión agotada decide la solución. |
| 4 | Reduce concurrencia y usa backoff con jitter | Reintentar demasiado rápido empeora el límite. |
| 5 | Acorta prompts y cachea respuestas repetidas | Baja requests y tokens al mismo tiempo. |
| 6 | Activa billing si el tráfico normal toca el techo | La capacidad de producción no debe depender de una cuota gratuita frágil. |
Si el error menciona billing, region, unsupported model o failed precondition, esperar al reset puede no bastar. Usa troubleshooting para separar agotamiento de cuota de problemas de configuración.
Diseño que sobrevive a cambios de cuota
Usa la capa gratuita para medir, no para prometer. Durante el desarrollo registra request count, prompt size, token usage, latency, retry count y failure rate. Así sabrás si tu carga real cabe en Free Tier sin depender de una tabla antigua.
Mantén model routing. Clasificación simple, extracción y respuestas cortas pueden ir a una ruta más ligera; razonamiento complejo, contexto largo y análisis de código deberían reservarse para un modelo más capaz. No es una forma de eludir límites, sino de gastar la cuota donde tiene más valor.
Cachea lo que pueda repetirse. FAQ bots, clasificadores, routing helpers y asistentes internos suelen repetir patrones. Un cache simple puede reducir RPM y TPM.
Registra errores por dimensión. Daily quota, token throughput y per-minute concurrency requieren fixes distintos. Un log que solo diga "Gemini failed" no ayuda a decidir.
Planifica la ruta pagada antes de necesitarla. Define qué proyecto tendrá billing, quién es budget owner, qué alertas usarás, qué datos pueden enviarse y qué umbral obliga a migrar.
Errores comunes
No lo llames "límite de la API key gratis". La forma correcta es project quota.
No copies tablas antiguas de RPM/RPD en requisitos de producción. Una tabla puede orientar, pero el número operativo debe venir de AI Studio.
No uses límites de la app Gemini como hechos de Gemini API. Consumer app, AI Studio, Gemini API y Vertex AI pueden tener contratos distintos.
No asumas que Google Cloud promotional credits cubren Gemini API. Comprueba la billing page antes de presupuestar.
No uses la capa gratuita para datos sensibles solo porque no cuesta dinero. Customer data, secretos de negocio, contenido regulado o cualquier dato que el usuario no esperaría ver usado para mejora de producto debe revisarse contra paid data terms.
Regla de decisión
Quédate en Free Tier si la carga es baja, no sensible, fácil de reintentar y sigue dentro de los live limits del proyecto en AI Studio.
Pasa a un proyecto con billing si el uso normal produce 429, necesitas throughput predecible, el modelo o función requerida no es gratis, importan privacy/compliance o un cambio de cuota causaría un fallo real para usuarios.
La capa gratuita sigue siendo útil, pero no es un derecho de producción. Trátala como un límite vivo de proyecto que se revisa, mide y confirma de nuevo.
Preguntas frecuentes
¿La capa gratuita de Gemini API todavía existe?
Sí. Algunas filas de modelo y superficies de Gemini API todavía tienen Free Tier. La disponibilidad exacta debe confirmarse en la página actual de precios de Google.
¿Dónde veo mis límites exactos de Gemini API gratis?
En AI Studio, dentro del proyecto que posee tu API key. Esa vista muestra live RPM, TPM, RPD, usage, reset behavior y billing state.
¿Cada Gemini API key recibe su propia cuota gratuita?
No. La key autentica llamadas. La cuota y billing pertenecen al Google Cloud project. Varias keys del mismo proyecto comparten los mismos límites.
¿Puedo aumentar la cuota creando más keys?
No. Más keys en el mismo proyecto sirven para rotación y separación de entornos, no para multiplicar cuota. Para más capacidad, reduce carga, cambia arquitectura o activa billing.
¿Qué significa 429 o RESOURCE_EXHAUSTED?
Normalmente una dimensión de rate limit se agotó. Revisa AI Studio para el mismo proyecto, confirma model ID, identifica si falló RPM, TPM o RPD, y decide si esperar, reducir, cachear o pagar.
¿Gemini 3 o Gemini 3.1 son gratis en la API?
No respondas desde memoria ni por apodos. Mira la Gemini API pricing page actual para la fila exacta de modelo y superficie. Algunas previews o funciones nuevas pueden ser paid-only.
¿Puedo usar Free Tier en producción?
Solo para workloads de bajo riesgo, bajo volumen, no sensibles y con tolerancia a fallos. Customer-facing, sensitive, high-volume o reliability-sensitive workloads deberían usar un proyecto con billing.
¿Los créditos de prueba de Google Cloud cubren Gemini API?
La billing page actual dice que los nuevos Google Cloud free-trial credits después de marzo de 2026 no aplican a Gemini API o AI Studio. Verifica la página antes de hacer supuestos de presupuesto.
¿La calidad del modelo cambia entre gratis y pago?
La diferencia clave suele estar en quota, feature access, data handling y predictibilidad operativa, no en una calidad artificialmente reducida. Comprueba el modelo y tier concretos en pricing y billing docs.
¿Qué debo registrar antes de depender del Free Tier?
Project ID, model ID, usage tier, live RPM/TPM/RPD desde AI Studio, reset behavior, billing state y fecha de revisión. Repite la comprobación antes de release, demo, migration y cambios de tráfico.



