Gemini API에는 여전히 일부 모델과 API surface에 무료 티어가 남아 있습니다. 하지만 "Gemini API 무료 티어 한도"를 하나의 고정된 공개 표로 이해하면 안 됩니다. 실제로 요청이 성공할지, 429로 막힐지를 결정하는 것은 API key 뒤의 Google Cloud 프로젝트, 호출하는 모델, usage tier, 지역, 결제 상태, 그리고 Google의 현재 정책입니다.
2026년 4월 25일 기준으로 가장 안전한 확인 순서는 두 단계입니다. 먼저 Google의 Gemini API pricing page에서 대상 모델 또는 기능 행이 Free Tier인지 확인합니다. 그다음 AI Studio에서 해당 API key가 속한 프로젝트를 열고, 현재 RPM, TPM, RPD, reset behavior, usage를 확인합니다. 같은 프로젝트에서 API key를 더 만들어도 무료 quota가 늘어나지 않습니다. key는 인증 정보이고, quota와 billing은 프로젝트가 소유합니다.
학습, 프롬프트 테스트, 작은 프로토타입, 낮은 빈도의 내부 도구에는 무료 티어가 여전히 쓸 만합니다. 그러나 외부 사용자가 있는 기능, 민감한 데이터, 안정적인 처리량, 반복적인 429, paid-only 모델 또는 기능이 필요하다면 무료 티어를 억지로 늘리기보다 결제가 연결된 프로젝트로 옮기는 것이 맞습니다.
| 질문 | 현재 답 | 확인할 곳 |
|---|---|---|
| Gemini API는 아직 무료인가? | 일부 모델과 API surface에는 Free Tier가 있다. | Google Gemini API pricing |
| 내 정확한 한도는 얼마인가? | 프로젝트, 모델, tier, 지역, 결제 상태에 따라 달라진다. | AI Studio 프로젝트 사용량 화면 |
| API key마다 별도 quota가 있는가? | 없다. key는 인증이고 quota는 프로젝트가 가진다. | API key와 billing 문서 |
| 한도를 넘으면 어떻게 되는가? | 보통 429 또는 RESOURCE_EXHAUSTED가 발생한다. | rate limits와 troubleshooting |
| production을 무료 티어로 운영할 수 있는가? | 저위험, 저트래픽, 실패 허용 상황에서만 가능하다. | billing, data handling, usage tiers |
Gemini API 무료 티어 한도는 한 숫자가 아니라 세 가지 판단이다
실제 운영에서는 "무료 티어", "무료 한도", "API 무료 제한"을 세 가지 판단으로 나누어야 합니다.
첫째, 모델이나 기능 자체가 무료 대상인지 확인해야 합니다. 이 답은 오래된 블로그 표나 커뮤니티 댓글이 아니라 Google의 현재 가격 페이지가 갖고 있습니다. 같은 Gemini 브랜드 안에서도 어떤 모델 행은 Free Tier이고, 어떤 preview, image, batch, specialized route는 paid-only일 수 있습니다. 그래서 "Gemini가 무료인가?"보다 "이 모델 행과 이 API surface가 지금 무료인가?"가 더 정확한 질문입니다.
둘째, rate limit의 차원을 이해해야 합니다. Gemini API rate limits 문서는 RPM, TPM, RPD를 핵심 차원으로 설명합니다. RPM은 분당 요청 수, TPM은 분당 token 수, RPD는 일일 요청 수입니다. 이 차원은 중요하지만, 공개 문서가 모든 프로젝트에 같은 값을 영구 보장한다는 뜻은 아닙니다.
셋째, 내 프로젝트가 지금 실제로 얼마나 쓸 수 있는지 확인해야 합니다. 이 답은 AI Studio의 project view에 있습니다. 프로젝트, 모델, region, usage tier, billing state가 바뀌면 실제 한도도 달라질 수 있습니다. 따라서 오래된 고정 RPM/RPD 표는 역사적 단서일 뿐, 출시 전 확인값이 될 수 없습니다.
어떤 답은 어떤 출처가 책임지는가
무료 티어 글이 자주 틀리는 이유는 pricing, rate limits, API key, billing, troubleshooting을 한 화면처럼 다루기 때문입니다. 안전한 글과 안전한 운영 문서는 각 답을 담당 출처에 배정합니다.
| 확인할 주장 | 가장 좋은 출처 | 사용 방법 |
|---|---|---|
| 모델 또는 기능에 Free Tier가 있는지 | Gemini API pricing | 현재 model row와 API surface를 확인한다. |
| RPM, TPM, RPD가 무엇인지 | Gemini API rate limits | 제한 차원, usage tier, reset behavior를 이해한다. |
| key가 어떤 프로젝트에 연결되는지 | Gemini API key documentation | credential과 project context를 확인한다. |
| billing을 켜면 무엇이 바뀌는지 | Gemini API billing documentation | paid project, data handling, credit exclusion을 본다. |
| 요청이 왜 실패했는지 | Gemini API troubleshooting | quota, billing, region, unsupported model을 분리한다. |
pricing은 모델 무료 상태를 알려 주지만 프로젝트의 실시간 quota를 대신하지 않습니다. rate limits 문서는 제한 차원을 설명하지만 API key가 별도 quota를 가진다고 말하지 않습니다. billing 문서는 paid tier와 데이터 처리 경계를 설명하지만 무료 프로젝트가 production에 충분하다고 보장하지 않습니다.
핵심은 간단합니다. 모델의 무료 상태, 프로젝트의 실시간 quota, billing state는 서로 다른 화면에서 확인해야 합니다.
API key는 quota 소유자가 아니다

API key는 credential입니다. 요청을 인증하고 어떤 project context로 호출하는지 연결하지만, 독립적인 quota pool을 만들지 않습니다.
같은 프로젝트에서 Key A와 Key B를 만들었다면 두 key는 같은 프로젝트 한도를 사용합니다. Key C를 추가하는 것은 rotation, 환경 분리, 보안 관리에는 도움이 되지만 무료 한도를 늘리지 않습니다. 이미 429가 나오는 프로젝트에서 같은 프로젝트의 key만 늘리면, 문제 해결이 아니라 사용량 추적만 더 복잡해집니다.
한도를 비교하기 전에 다음을 확인해야 합니다.
| 확인 항목 | 이유 |
|---|---|
| 어떤 Google account가 key를 만들었는가 | 관리 화면 접근 경로가 달라진다. |
| key 뒤의 Google Cloud project는 무엇인가 | quota, billing, usage report는 프로젝트에 속한다. |
| billing이 켜져 있는가 | usage tier와 data handling이 달라질 수 있다. |
| 코드가 호출하는 model ID는 무엇인가 | 모델 행마다 무료 상태와 한도가 다르다. |
| AI Studio에서 같은 project를 보고 있는가 | 다른 project 화면은 잘못된 한도를 보여 준다. |
새 key를 quota 우회 수단으로 쓰지 마십시오. 필요한 것은 프로젝트 확인, 부하 감소, retry 수정, 캐싱, 그리고 필요할 때 결제 활성화입니다.
무료 티어가 맞는 경우와 결제가 맞는 경우
무료 티어는 개발과 검증을 위한 lane으로 생각하면 가장 안전합니다. API 학습, prompt 비교, 작은 프로토타입, synthetic data 기반 내부 demo, 가끔 실행되는 내부 도구에는 잘 맞습니다.
하지만 무료 티어는 production entitlement가 아닙니다. 외부 사용자가 있고, 실패가 곧 장애이며, sensitive data를 처리하고, 안정적인 throughput이 필요하거나, 필요한 모델 행이 paid-only라면 billed project가 더 자연스러운 경로입니다.

| 작업 유형 | 무료 티어 적합도 | billed project 적합도 |
|---|---|---|
| API 학습 | 적합 | 보통 불필요 |
| synthetic data 기반 작은 prototype | 낮은 사용량이면 적합 | 실제 throughput 테스트에는 유용 |
| 내부 demo | 실패 허용 시 가능 | 중요한 demo에는 더 안전 |
| customer-facing feature | 위험 | 보통 정답 |
| sensitive / regulated / proprietary data | 기본적으로 피해야 함 | paid data terms 확인 후 사용 |
| high-volume batch | 부적합 | paid tier 또는 batch route 필요 |
| paid-only model / feature | 사용 불가 | 필수 |
예산도 따로 확인해야 합니다. 현재 Google billing 문서는 2026년 3월 이후 생성된 새 Google Cloud free-trial credits가 Gemini API 또는 AI Studio 사용량에 적용되지 않는다고 설명합니다. 따라서 Cloud trial credit을 Gemini API 무료 예산처럼 적기 전에 반드시 현재 billing page를 다시 확인해야 합니다.
AI Studio에서 실제 한도를 확인하는 방법
절차는 짧지만, 프로젝트가 틀리면 의미가 없습니다.
- API key를 관리하는 Google account로 AI Studio를 연다.
- 애플리케이션이 사용하는 key의 프로젝트를 선택한다.
- usage 또는 rate-limit view를 연다.
- 코드의 model ID와 dashboard의 model을 맞춘다.
- RPM, TPM, RPD, reset behavior, usage tier, billing state를 기록한다.
- release, demo, migration, traffic change 전에 다시 확인한다.
여러 key를 비교할 때도 key 단위가 아니라 project 단위로 봐야 합니다. 같은 프로젝트의 여러 key는 하나의 quota owner를 공유합니다. 서로 다른 프로젝트는 같은 모델을 호출해도 billing, region, account history, tier 때문에 다른 상태를 가질 수 있습니다.
RPM, TPM, RPD의 자세한 해석은 Gemini API rate limits guide를 참고하면 됩니다. 여기서 필요한 결론은 하나입니다. 세 차원 중 하나라도 소진되면 나머지가 남아 있어도 요청은 실패할 수 있습니다.
429 또는 RESOURCE_EXHAUSTED가 나올 때의 순서
429는 무료 티어가 사라졌다는 뜻이 아닙니다. 더 흔한 원인은 특정 rate-limit dimension 소진, 잘못된 프로젝트 확인, 잘못된 model ID, paid-only 모델 호출, region 또는 billing state 문제, 혹은 retry가 너무 공격적인 경우입니다.

| 순서 | 조치 | 이유 |
|---|---|---|
| 1 | key 뒤의 프로젝트를 AI Studio에서 확인 | 실제 quota owner를 먼저 확인한다. |
| 2 | model ID와 API surface를 확인 | paid-only 또는 preview route면 기다려도 해결되지 않는다. |
| 3 | RPM, TPM, RPD를 따로 본다 | 소진된 차원에 따라 수정 방법이 다르다. |
| 4 | concurrency를 낮추고 backoff with jitter를 넣는다 | 빠른 retry는 throttling을 악화시킨다. |
| 5 | prompt를 줄이고 반복 응답을 cache한다 | requests와 tokens를 동시에 줄인다. |
| 6 | 정상 트래픽에서 계속 한도에 닿으면 billing을 켠다 | production capacity를 fragile free quota에 의존시키지 않는다. |
오류 메시지가 billing, region, unsupported model, failed precondition을 말한다면 reset을 기다리는 것만으로는 해결되지 않을 수 있습니다. troubleshooting 문서로 quota exhaustion과 setup error를 나눠야 합니다.
무료 티어 변화에 버티는 설계
무료 한도는 바뀔 수 있다고 가정해야 합니다. 개발 중에는 request count, prompt size, token usage, latency, retry count, failure rate를 기록합니다. 이렇게 해야 내 workload가 무료 티어에 맞는지 알 수 있고, 오래된 숫자표에 의존하지 않게 됩니다.
Model routing을 둡니다. 간단한 classification, extraction, short answer는 빠르고 가벼운 모델로 보내고, 복잡한 reasoning, 긴 context, code analysis만 더 강한 모델로 보냅니다. 이는 한도 우회가 아니라 제한된 quota를 필요한 호출에 쓰는 설계입니다.
반복될 수 있는 결과는 cache합니다. FAQ bot, 분류기, routing helper, internal assistant는 비슷한 prompt를 자주 보냅니다. cache는 RPM과 TPM을 동시에 줄입니다.
오류는 차원별로 기록합니다. daily quota, token throughput, per-minute concurrency는 해결 방식이 다릅니다. "Gemini failed"라는 로그만 남기면 다음 조치를 알 수 없습니다.
paid path도 미리 정합니다. 어떤 프로젝트에 billing을 연결할지, budget owner는 누구인지, alert threshold는 얼마인지, 어떤 데이터를 보낼 수 있는지 한도에 닿기 전에 결정해야 합니다.
피해야 할 오해
"무료 API key 한도"라고 부르지 마십시오. 정확한 표현은 project quota입니다.
오래된 RPM/RPD 표를 production 요구사항에 붙이지 마십시오. 표는 규모를 이해하는 데 도움이 될 수 있지만, 현재 운영 숫자는 AI Studio가 갖고 있습니다.
Gemini app 사용 제한을 Gemini API 사실로 쓰지 마십시오. consumer app, AI Studio, Gemini API, Vertex AI는 서로 다른 계약일 수 있습니다.
Google Cloud promotional credits가 Gemini API에 적용된다고 가정하지 마십시오. 예산을 쓰기 전에 현재 billing page를 확인해야 합니다.
무료라고 해서 privacy 측면에서도 안전하다고 생각하지 마십시오. customer data, business secrets, regulated material을 보낼 때는 paid data terms를 먼저 확인해야 합니다.
최종 판단 규칙
workload가 low-volume, non-sensitive, retry 가능하고, AI Studio live limits 안에 있다면 무료 티어를 계속 써도 됩니다.
일반 트래픽에서 429가 반복되고, predictable throughput이 필요하며, 필요한 model 또는 feature가 paid-only이고, privacy/compliance가 중요하거나, quota change가 사용자 실패로 이어진다면 billed project로 옮기십시오.
무료 티어는 유용하지만 production 권리가 아닙니다. 항상 확인하고, 측정하고, 다시 확인해야 하는 project-level limit로 다루어야 합니다.
자주 묻는 질문
Gemini API 무료 티어는 아직 있나요?
있습니다. 일부 Gemini API model row와 API surface에는 Free Tier가 있습니다. 정확한 대상은 현재 Google pricing page에서 확인해야 합니다.
내 정확한 Gemini API 무료 한도는 어디서 보나요?
API key 뒤의 프로젝트를 AI Studio에서 확인합니다. 그 project dashboard가 live RPM, TPM, RPD, usage, reset behavior, billing state를 보여 줍니다.
API key마다 별도 무료 quota가 있나요?
없습니다. API key는 인증 정보이고 quota와 billing은 Google Cloud project에 속합니다. 같은 프로젝트의 여러 key는 같은 project limits를 공유합니다.
key를 더 만들면 무료 quota가 늘어나나요?
늘어나지 않습니다. 같은 프로젝트 안의 새 key는 rotation과 환경 분리에는 좋지만 quota를 늘리지 않습니다. 더 많은 capacity가 필요하면 부하 감소, 아키텍처 변경, billing을 검토해야 합니다.
429 또는 RESOURCE_EXHAUSTED는 무엇을 의미하나요?
대개 RPM, TPM, RPD 중 하나가 소진되었다는 뜻입니다. 같은 프로젝트의 AI Studio 사용량, model ID, retry pattern을 확인한 뒤 기다리기, 줄이기, cache하기, billing 켜기 중 하나를 선택합니다.
Gemini 3 또는 Gemini 3.1은 API에서 무료인가요?
기억이나 별칭으로 답하지 말고 현재 Gemini API pricing page에서 정확한 model row와 surface를 확인해야 합니다. 일부 신규 또는 preview 모델은 paid-only일 수 있습니다.
무료 티어를 production에 쓸 수 있나요?
저위험, 저트래픽, 실패 허용, non-sensitive workload라면 가능할 수 있습니다. customer-facing, sensitive, high-volume, reliability-sensitive workload에는 billed project가 맞습니다.
Google Cloud free-trial credits가 Gemini API에 적용되나요?
현재 billing page는 2026년 3월 이후의 새 Google Cloud free-trial credits가 Gemini API 또는 AI Studio에 적용되지 않는다고 설명합니다. 예산에 반영하기 전에 다시 확인하세요.
무료 티어와 유료 티어의 모델 품질이 다른가요?
중요한 차이는 보통 품질이 아니라 quota, feature access, data handling, operational predictability입니다. 구체적인 모델과 tier는 pricing과 billing docs에서 확인하세요.
무료 티어에 의존하기 전에 무엇을 기록해야 하나요?
project ID, model ID, usage tier, AI Studio의 live RPM/TPM/RPD, reset behavior, billing state, 확인 날짜를 기록합니다. release, demo, migration, traffic change 전에 다시 확인합니다.



