OpenAI 기반 워크플로, Image API, 편집, 참조 이미지, OpenAI 계정과 지원 경계가 중요하면 먼저 GPT Image 2를 테스트한다. Google 쪽에서 빠르게 많은 변형을 만들고 비용을 낮추는 것이 중요하면 먼저 Gemini 3.1 Flash Image를 테스트한다. 텍스트가 많은 이미지, 복잡한 레이아웃, 4K 결과물, Search grounding, 승인 실패 비용이 큰 작업이라면 먼저 Gemini 3 Pro Image를 테스트한다.
핵심은 절대적인 모델 순위가 아니다. 어떤 공식 경로를 통합할지, 어떤 작업에서 실패가 비싼지, 동일한 프롬프트 검증으로 무엇을 통과해야 프로덕션 전환이 가능한지를 정하는 것이다.
| 경로 | 먼저 테스트할 때 | 보류할 때 |
|---|---|---|
| GPT Image 2 | OpenAI Image API, 편집, 참조 이미지, OpenAI 청구와 지원 경계가 필요하다. | 이미 Google 스택이고 Flash가 같은 프롬프트를 통과한다. |
| Gemini 3.1 Flash Image | Google API에서 빠른 반복, 대량 변형, 비용 민감 테스트가 필요하다. | 텍스트, 레이아웃, 4K, grounding, 실패 비용이 더 중요하다. |
| Gemini 3 Pro Image | 밀도 높은 텍스트, 복잡한 구성, 제품 목업, 4K 최종본처럼 반려 비용이 크다. | Flash가 같은 프롬프트를 충분히 통과한다. |
Nano Banana 2는 개발자 기준에서 gemini-3.1-flash-image로 다루면 된다. Nano Banana Pro는 gemini-3-pro-image다. gemini-3.1-flash-image-preview와 gemini-3-pro-image-preview는 새 구현의 출발점이 아니라 이전 테스트와 코드를 정리할 때 확인할 ID다.
품질 비교 전에 현재 ID를 고정한다
가장 먼저 할 일은 별칭이 아니라 호출할 모델 ID를 확인하는 것이다. OpenAI 이미지 생성 문서에서 GPT Image 2의 직접 이미지 경로는 Image API의 gpt-image-2다. Responses API에서도 image_generation 도구를 통해 이미지 생성이 가능하지만, 직접 Image API 호출과는 설계와 처리 방식이 다르다. 백엔드 이미지 엔드포인트라면 이 두 표면을 먼저 분리해야 한다.
Google 쪽도 두 경로가 있다. Gemini 3.1 Flash Image는 gemini-3.1-flash-image이며, 독자에게는 Nano Banana 2로 알려질 수 있다. Gemini 3 Pro Image는 gemini-3-pro-image이며, Nano Banana Pro로 불린다. Google changelog는 두 안정 ID가 2026년 5월 28일 GA가 되었고, preview ID는 2026년 6월 25일 종료 예정이라고 설명한다.

오래된 예제나 벤치마크에 preview ID가 남아 있다고 해서 현재 모델 품질을 평가할 수는 없다. 테스트 harness가 preview ID를 부르면 먼저 안정 ID로 바꾼다. 그다음 속도, 비용, 재시도, 통과한 결과물을 비교한다.
| 표시 이름 | 현재 API ID | 소유자 | 판단에 쓰는 곳 |
|---|---|---|---|
| GPT Image 2 | gpt-image-2 | OpenAI | OpenAI 기반 생성, 편집, 참조 이미지, 출력 제어. |
| Nano Banana 2 | gemini-3.1-flash-image | 빠른 변형, 대량 테스트, 비용 민감 Google 경로. | |
| Nano Banana Pro | gemini-3-pro-image | 복잡한 디자인, 밀도 높은 텍스트, 제품 목업, grounding, 최종 에셋. |
경로 소유자가 먼저 결정된다
GPT Image 2를 먼저 테스트하는 이유는 스타일만이 아니다. OpenAI 인증, 로그, 청구, 지원, 편집, 품질 설정, 출력 형식, 압축, 멀티스텝 작업을 같은 환경에서 유지할 수 있다. OpenAI 문서는 GPT Image 모델 사용에 조직 인증이 필요할 수 있다고 안내하므로, 접근 조건도 경로 선택에 포함해야 한다.
Gemini 3.1 Flash Image는 Google 쪽에서 속도와 비용 균형을 먼저 보는 기본 후보에 가깝다. 광고 초안, 제품 이미지 변형, 내부 검토, 가벼운 마케팅 이미지, 많은 수의 실험에서는 Pro부터 시작할 필요가 없을 수 있다. Flash가 기준을 통과하면 Pro는 품질 향상이 아니라 비용 증가일 수 있다.
Gemini 3 Pro Image는 실패가 비싼 작업에 맞는다. 다국어 포스터, 복잡한 UI 보드, 설명 텍스트가 들어간 제품 이미지, 4K 히어로 이미지, grounded 시각화, 최종 마케팅 소재는 작은 오류도 재작업으로 이어진다. Pro의 역할은 이름값이 아니라 실패 비용을 줄이는 것이다.

4K만으로 Pro를 고르는 것도 부정확하다. Google 이미지 생성 문서는 Gemini 3 이미지 모델이 1K, 2K, 4K를 지원하고 Flash는 512도 지원한다고 설명한다. 4K 결과물에 동시에 텍스트, 복잡한 레이아웃, grounding, 승인 실패 위험이 있는지 봐야 한다.
가격은 공식 소유자별로 읽는다
가격 비교는 반드시 어느 회사의 가격인지 붙어 있어야 한다. 2026년 6월 13일 기준 OpenAI 이미지 생성 문서는 gpt-image-2 예시 비용으로 1024x1024 low, medium, high를 약 $0.006, $0.053, $0.211로 제시했다. 1024x1536 또는 1536x1024는 약 $0.005, $0.041, $0.165 예시가 있다.
이 숫자는 모든 이미지의 고정 단가가 아니다. 입력 이미지, 편집, 출력 품질, 크기, 생성 token, 재시도, 캐시, Responses 워크플로 포함 여부에 따라 달라진다. 실무적으로는 GPT Image 2의 low quality 테스트는 낮게 시작할 수 있지만 high quality 결과물은 크게 비싸질 수 있음을 보여 준다.
Google 가격 구조는 다르다. 같은 날짜의 Gemini API 가격표에서 Gemini 3.1 Flash Image 표준 이미지 출력은 0.5K $0.045, 1K $0.067, 2K $0.101, 4K $0.151로 제시된다. Gemini 3 Pro Image 표준 출력은 1K/2K $0.134, 4K $0.24다.
따라서 가장 싼 경로는 작업 없이 정할 수 없다. OpenAI low-quality 테스트가 특정 Google 행보다 낮을 수 있고, high-quality OpenAI 출력은 Flash나 Pro보다 비쌀 수 있다. Pro가 어떤 크기에서 OpenAI 예시보다 낮아 보여도 OpenAI 편집이나 통합 지원이 필요한 제품에는 맞지 않을 수 있다.
OpenAI 비용 경로는 GPT Image 2 API cheap route에서, Google 내부 Flash와 Pro 선택은 Gemini 3 Pro Image vs Gemini 3.1 Flash Image에서 좁게 보는 것이 좋다.
동일 프롬프트로 프로덕션 전환을 검증한다
공개 벤치마크는 후보를 고르는 데 도움을 주지만, 프로덕션 전환의 근거는 아니다. 같은 프롬프트, 같은 참조 이미지, 같은 목표 크기, 같은 언어 조건, 같은 승인 기준으로 테스트해야 한다.

| 검증 프롬프트 | 드러나는 문제 | 포함할 경로 |
|---|---|---|
| 텍스트가 많은 포스터 | 철자, 위계, 타이포그래피, 레이아웃. | GPT Image 2와 Gemini 3 Pro Image, 필요하면 Flash. |
| 제품 이미지 | 물체 일관성, 조명, 사실성, 제어성. | Gemini 3.1 Flash Image와 Gemini 3 Pro Image. |
| 참조 이미지 편집 | 원본 물체와 편집 지시를 동시에 지키는지. | GPT Image 2와 목표 Google 경로. |
| 다이어그램 또는 UI 보드 | 구조, 라벨, 시각적 위계. | GPT Image 2와 Gemini 3 Pro Image. |
| 4K 히어로 이미지 | 세부 안정성, 확대 품질, 최종 에셋 품질. | Gemini 3 Pro Image, Flash, 현재 기준. |
| 다국어 카피 | 비영어 텍스트, 줄바꿈, 배치. | 남은 모든 후보. |
최종 이미지만 저장하면 부족하다. 프롬프트, 참조 파일, 크기, 품질, 비율, 재시도 수, 거절 이유, 지연 시간, 추정 비용을 함께 남긴다. 한 장의 멋진 출력보다 반복해서 승인 기준을 통과하는 경로가 제품 운영에서는 더 강하다.
테스트 결과를 경로 결정으로 바꾼다
세 경로를 같은 조건으로 돌린 뒤에는 평균 점수만 보지 않는 편이 안전하다. 각 테스트를 “반드시 통과해야 하는 항목”, “재작업으로 해결 가능한 항목”, “취향 차이”로 나눈다. 반드시 통과해야 하는 항목에는 텍스트 오류가 없는지, 제품 형태가 유지되는지, 참조 이미지의 주체가 사라지지 않는지, 브랜드 색상이 크게 벗어나지 않는지, 4K 확대에서 중요한 디테일이 무너지지 않는지가 들어간다. 이 항목에서 실패한 경로는 이미지가 더 근사해 보여도 기본 프로덕션 경로가 되기 어렵다.
재작업으로 해결 가능한 항목은 구도 여백, 약간의 조명 차이, 배경 정리, 스타일 일관성 같은 부분이다. 여기서는 실패 여부보다 합격까지 필요한 재시도 횟수가 중요하다. Flash가 한두 번 더 재시도해도 전체 비용과 일정이 낮게 유지된다면 Flash가 더 좋은 기본값일 수 있다. 반대로 재시도가 검수 대기, 내부 승인, 고객 확인까지 늘린다면 Pro나 GPT Image 2를 먼저 올릴 이유가 생긴다.
취향 차이는 색감, 카메라 느낌, 질감, 더 고급스러워 보이는지 같은 판단이다. 이런 피드백은 프롬프트 템플릿을 조정하는 데는 유용하지만 API 소유자, 접근 조건, 청구, 로그, 실패 비용보다 앞서면 안 된다. 보기 좋은 한 장으로 경로를 바꾸면 실제 운영에서는 텍스트, 참조 이미지 편집, 다국어 카피에서 반복적으로 되돌아갈 수 있다.
| 판단 항목 | GPT Image 2가 먼저인 경우 | Gemini 3.1 Flash Image가 먼저인 경우 | Gemini 3 Pro Image가 먼저인 경우 |
|---|---|---|---|
| 구현 경계 | OpenAI Image API, 편집, 참조 이미지, OpenAI 운영 경계가 이미 중심이다. | Google API가 중심이고 이미지 생성 기능을 빠르게 추가해야 한다. | Google API가 중심이지만 Flash 실패가 비싸다. |
| 비용 구조 | low quality 테스트가 가볍고 high quality 비용도 OpenAI 통합 가치로 설명된다. | 대량 변형, 낮은 실패 비용, 허용 가능한 재시도가 중요하다. | 한 장 가격보다 재작업과 승인 실패 감소가 더 중요하다. |
| 품질 위험 | 편집, 출력 제어, OpenAI 생태계 안의 일관성이 중요하다. | 일반 생성, 광고 초안, 내부 검토, 후보 대량 생성이 많다. | 밀도 높은 텍스트, 복잡한 레이아웃, 4K, 제품 최종본, grounding이 중요하다. |
| 마이그레이션 | 공급자와 로그를 더 늘리고 싶지 않다. | preview ID 정리가 끝났고 Google 쪽 한도와 모니터링이 명확하다. | Pro 비용과 실패 처리 방식이 이미 운영 예산에 들어갔다. |
마지막에는 기본 경로가 “왜 나머지 두 경로가 아닌가”를 설명할 수 있어야 한다. OpenAI 편집이 접속 면을 줄인다, Flash가 허용 가능한 재시도로 대량 이미지를 통과한다, Pro가 텍스트가 많은 최종 소재의 재작업을 줄인다는 식의 설명이 가능해야 한다. 그런 설명 없이 더 좋아 보인다는 이유만 남으면 프로덕션 결정으로는 약하다.
중단 규칙을 먼저 정한다
이미 Google 스택이고 대부분 일반 생성이며 Gemini 3.1 Flash Image가 같은 프롬프트를 더 낮은 총비용으로 통과한다면 GPT Image 2를 기본으로 둘 이유가 약해진다. OpenAI 편집, 출력 제어, Responses 연동, OpenAI 계정 소유 경계가 필요할 때만 마지막까지 남긴다.
Flash가 텍스트, 복잡한 레이아웃, grounding, 4K 검수, 제품 승인에서 반복 실패하면 Gemini 3 Pro Image로 올라간다. Pro는 더 높은 이름이라서 쓰는 것이 아니라 실패 유형을 줄이기 위해 쓰는 경로다.
Flash가 같은 프롬프트를 통과하고 재시도, 지연, 비용이 허용 범위라면 Pro를 기본값으로 둘 필요가 없다. 프리미엄 경로는 재작업을 줄일 때 가치가 있다.
테스트에 preview ID가 남아 있으면 비교를 멈춘다. ID 마이그레이션 전의 오류는 모델 품질이 아니라 접근 경계 문제일 수 있다.
관련 질문은 분리한다
세 경로 비교는 첫 테스트와 프로덕션 전환 증거를 정하는 일에 집중해야 한다. Google 내부 Flash와 Pro 차이는 Gemini 3 Pro Image vs Gemini 3.1 Flash Image에서, OpenAI 크기와 4K 작업은 GPT Image 2 4K image generation에서, OpenAI 무료 API 경계는 Is GPT Image 2 API free에서 확인하는 편이 낫다.
한 결정에 가격, 무료 사용, 4K, 공급자, 오류 해결, 순위를 모두 넣으면 답이 얕아진다. 먼저 경로를 정하고 좁은 문제로 이동하는 방식이 더 안전하다.
자주 묻는 질문
GPT Image 2가 Gemini 3 Pro Image보다 좋은가요?
항상 그렇지는 않다. OpenAI 기반 생성, 편집, 출력 제어, OpenAI 계정 경계가 중요하면 GPT Image 2를 먼저 테스트한다. Google 쪽에서 텍스트, 복잡한 레이아웃, grounding, 4K, 승인 실패 비용이 중요하면 Gemini 3 Pro Image를 먼저 테스트한다.
Nano Banana 2는 Gemini 3.1 Flash Image인가요?
API 기준으로는 그렇게 다룬다. Nano Banana 2는 독자가 알아보기 쉬운 별칭이고, 코드와 로그, 가격, 마이그레이션에는 gemini-3.1-flash-image를 쓴다.
Nano Banana Pro는 Gemini 3 Pro Image인가요?
그렇다. Nano Banana Pro는 gemini-3-pro-image의 독자용 이름이다. API 호출과 가격표에서는 모델 ID를 쓰는 것이 안전하다.
Gemini preview ID를 계속 써도 되나요?
새 구현에는 쓰지 않는다. Google changelog는 gemini-3.1-flash-image-preview와 gemini-3-pro-image-preview가 2026년 6월 25일 종료 예정이라고 설명한다. 기존 테스트 정리에만 사용한다.
어떤 경로가 가장 저렴한가요?
크기, 품질, 재시도, 승인률 없이는 답할 수 없다. GPT Image 2 low quality 예시는 낮을 수 있지만 high quality는 높아진다. Flash는 Google의 비용 민감 경로이고 Pro는 비싸지만 어려운 에셋의 재작업을 줄일 수 있다.
텍스트가 많은 이미지에는 무엇이 좋나요?
OpenAI 편집과 출력 제어가 중요하면 GPT Image 2부터 시작한다. Google 스택에서 복잡한 텍스트, 레이아웃, grounding, 최종 검수가 중요하면 Gemini 3 Pro Image부터 시작한다. 텍스트 부담이 중간이라면 Flash도 같은 프롬프트에 넣어 비용 기준으로 삼는다.



