Nano Banana 2 と Nano Banana Pro の選び方：価格、品質、API ルート

多くの Google 画像生成 API ワークロードでは、最初から Nano Banana Pro を本番の既定ルートにする必要はありません。まず Nano Banana 2 を試し、同じ条件で失敗の出方を記録し、それでも採用できる出力が安定しないときに Pro 側を精度重視の上位ルートとして比較します。呼び出し ID は gemini-3.1-flash-image と gemini-3-pro-image です。記事や管理画面の表示名だけで判断せず、実際に送る ID 文字列を確認します。

2026年6月21日時点で、Google の Gemini API 価格表ではこの二つの画像ルートに Free Tier は表示されていません。Nano Banana 2 / Flash の標準画像例は 0.5K が 0.045 ドル、4K が 0.151 ドルまで、Nano Banana Pro は 1K/2K が 0.134 ドル、4K が 0.24 ドルです。しかし制作現場で重要なのは「生成一回の価格」ではなく「採用できた出力一件あたりの総コスト」です。リトライ、手直し、レビュー、差し戻し、納期遅れ、ブランドリスクまで含めて判断しないと、安いルートが実は高くなることがあります。

基本ルール: 日常的なバリエーション作成、社内レビュー用の案出し、商品画像の探索、軽い編集、プロンプト調整、コスト重視のバッチ生成は Flash から始めます。密な文字、複雑なレイアウト、参照画像の厳密な保持、重要な 4K ビジュアル、ブランド審査や顧客確認を通す完成素材では Pro を早めに比較します。

停止ルール: Pro という名前が強そうだから全トラフィックを移す、という判断は避けます。同じプロンプト、同じ参照画像、同じアスペクト比、同じ解像度、同じ合格基準で両ルートを走らせ、採用できた出力のコストとレビュー負荷を比べてから切り替えます。

現在のモデル ID を先に確定する

この比較で最初に直すべき点は品質評価ではなく、呼び出し文字列です。現在の公式ドキュメントと価格表では gemini-3.1-flash-image と gemini-3-pro-image が画像ルートの中心です。古い記事、古い SDK サンプル、第三者ダッシュボード、既存コードには gemini-3.1-flash-image-preview や gemini-3-pro-image-preview のような表記が残っていることがありますが、新規実装の標準値としてそのままコピーしないほうが安全です。

モデル名を短く書くと誤解が起きます。gemini-3-pro-image は Pro の画像エンドポイントであり、単なる Gemini Pro テキストモデルではありません。gemini-3.1-flash-image も Flash 系の画像エンドポイントであり、汎用の Flash テキストルートとは別物です。ログや UI が「Gemini Pro」「Flash」だけを表示している場合は、最終的な model フィールドを確認してから性能や価格を比較します。

表示名	現在の API モデル ID	実務上の役割
Nano Banana 2	`gemini-3.1-flash-image`	高頻度、反復、量産、コスト重視の画像生成と編集で最初に試すルート。
Nano Banana Pro	`gemini-3-pro-image`	文字、構図、参照忠実度、完成品質、失敗コストが重いときの上位ルート。
古い Flash preview 例	`gemini-3.1-flash-image-preview` など	既存コードの移行手掛かりとして扱い、現在の既定値にはしない。
古い Pro preview 例	`gemini-3-pro-image-preview` など	プラットフォームが今日も明記している場合を除き、歴史的な例として扱う。

API、AI Studio、Gemini アプリ、Cloud または Vertex、第三者ラッパーは、それぞれ枠、地域、課金主体、レスポンス形、失敗時の扱いが違う場合があります。モデル ID は比較の出発点ですが、利用面の契約全体を代表するものではありません。

Flash は低品質版ではなく標準ルート

Gemini 3.1 Flash Image を先に試す理由は、安いから適当に使うためではありません。速度と高頻度の利用に向いたルートとして、失敗一回の影響が小さく、反復が前提の仕事に合いやすいからです。SNS バリエーション、社内のクリエイティブ探索、商品画像の大量案、キャンペーンのラフ、カタログ更新、プロンプト検証では、最初から最高単価の一回を狙うより、許容できる出力を早く多数得ることが価値になります。

Flash を使うときも、品質基準を曖昧にしてはいけません。短い文字、単純なレイアウト、軽い参照画像、内部レビュー用の素材であれば、少しの修正や再生成で十分な場合が多いです。逆に、同じ種類のミスが何度も起き、レビューや手直しの負担が積み上がるなら、その時点で Pro を比較します。

ワークロードのサイン	Flash を先に置きやすい理由
多数の案が必要	反復が前提なので、低い原価と速い確認が効きます。
出力が社内確認用	小さな欠点は方向性判断には影響しにくく、再生成も許容されます。
文字が短い、または重要でない	Pro の文字・レイアウト優位が最終成果に直結しないことがあります。
参照忠実度が参考程度	完全一致よりも近い方向性があれば企画段階では十分です。
4K が唯一の要件ではない	高解像度対応だけで Pro を選ぶのではなく、完成リスクで判断します。

Flash が実際の合格基準を満たすなら、そのまま標準ルートにします。他人のベンチマーク画像や単発のスクリーンショットではなく、自分のプロンプト、自分の参照素材、自分のレビュー基準で判断することが重要です。

Pro は精度と失敗コストのための上位ルート

Gemini 3 Pro Image は、出力の失敗が高くつく場面で価値が出ます。ここでいう高コストとはモデル料金だけではありません。誤字の修正、構図の作り直し、参照商品の形状ずれ、レビュー待ち、クライアント差し戻し、法務確認、デザイナーの再作業、公開遅延も含みます。一枚のメニュー画像やパッケージ案で文字が崩れると、安い生成を何度も繰り返すより Pro のほうが安くなることがあります。

Pro を早めに試すべき仕事は、完成素材としてそのままレビューに出るものです。情報図、広告キービジュアル、商品ローンチ画像、パッケージ mockup、ブランドテンプレート、多言語文字入り素材、複雑な図解、厳密な参照画像編集では、少数のミスが全体の信用を落とします。失敗を減らせるなら、一回の料金差よりレビュー時間の削減のほうが大きなメリットになります。

Pro を検討する条件	測るべき点
文字やラベルが密	誤字、句読点、反復語、配置、階層、整列を確認します。
レイアウトが複雑	複数領域、グルーピング、視線順序が安定しているかを見ます。
参照画像の保持が重要	物体の形、姿勢、材質、ブランド形状、背景条件を比べます。
4K 完成素材	拡大時の細部、ノイズ、文字の鮮明さ、局所的な破綻を確認します。
失敗時の人件費が高い	手直し時間、レビュー遅延、再納品、機会損失を入れて計算します。

これらの条件がなければ、Pro はスポット確認で十分です。標準ルートを入れ替える理由は「高級そう」ではなく、採用できる出力をより少ない総コストで安定して得られることです。

価格は採用できた出力あたりで見る

2026年6月21日時点の Gemini API 価格表では、gemini-3.1-flash-image の標準入力は text/image tokens 100万あたり 0.50 ドル、画像出力は output tokens 100万あたり 60 ドルです。画像例では 0.5K が 0.045 ドル、1K が 0.067 ドル、2K が 0.101 ドル、4K が 0.151 ドルです。Batch 例は 0.022、0.034、0.050、0.076 ドルですが、バッチ遅延を許容できる仕事だけに意味があります。

gemini-3-pro-image は標準入力が text/image tokens 100万あたり 2 ドル、画像出力が image tokens 100万あたり 120 ドルで、1K/2K が 0.134 ドル、4K が 0.24 ドルという例示です。Batch/Flex 例は 1K/2K が 0.067 ドル、4K が 0.12 ドルです。リアルタイム編集やユーザー待ちの API では、Batch/Flex の価格だけを取り出して同じ比較表に混ぜないほうが安全です。

この表は一回生成の境界を示しますが、制作判断はそれだけでは足りません。Flash 4K を二回走らせて合格するなら、Pro を使うより安いことがあります。反対に Flash を五回試しても文字や構図の修正が必要なら、Pro の一回か二回のほうが総コストを下げるかもしれません。

指標	記録方法
生成した出力数	採用した画像だけでなく、課金されたすべての生成を数えます。
採用できた出力数	実際に公開、納品、または次工程に進めたものだけを数えます。
手直しコスト	修字、レタッチ、再生成、承認待ち、レビュー時間を見積もります。
採用出力コスト	`(モデル費用 + 手直しコスト) / 採用できた出力数` で比較します。
切り替えライン	Pro が採用コストまたは許容不能リスクを下げるときだけ切り替えます。

実際の判断では、モデル費用、手直し時間、採用できた出力数を同じ表に入れます。Flash 4K の 0.151 ドルは、少ない試行で合格する限り Pro 4K の 0.24 ドルより有利です。逆に文字や構図の失敗が続くなら、人の修正コストが価格差をすぐに上回ります。

能力差はタスクに戻して評価する

二つのルートはどちらも画像生成、編集、高解像度出力、文字レンダリング、検索 grounding、thinking、複数参照画像という文脈を持っています。違いは「機能があるかないか」だけではなく、どの失敗を減らしたいかです。Flash は 131,072 input tokens と 32,768 output tokens が示され、text と image/PDF input、image/text output、Search grounding、thinking を持ちます。Pro は 65,536 input tokens と 32,768 output tokens で、image/text input、image/text output、Search grounding、structured outputs、priority inference、Flex inference、Batch API に対応し、専門的な完成素材に向いた位置づけです。

能力	Gemini 3.1 Flash Image	Gemini 3 Pro Image	判断への影響
公式上の役割	速度と高頻度利用	専門的なアセット制作	Flash で始め、精度が必要なら Pro を試します。
現在の ID	`gemini-3.1-flash-image`	`gemini-3-pro-image`	コードには完全な image ID を使います。
入力上限	131,072 tokens	65,536 tokens	広い入力文脈は Flash の利点になる場合があります。
出力上限	32,768 tokens	32,768 tokens	主要な差ではありません。
解像度行	512、1K、2K、4K preview	1K、2K、4K preview	4K は Pro だけの理由ではありません。
構造化と運用モード	Search grounding、thinking	Search grounding、structured outputs、priority inference、Flex、Batch	Pro は複雑な完成素材ワークフローの精度ルートになりやすい。
文字とレイアウト	対応	精度重視の上位候補	密なタイポグラフィでは Pro を比較します。

表の一項目を勝敗にしないことが大切です。あるモデルが文字入り素材で強くても、大量の軽いバリエーションに常に向くとは限りません。逆に Flash が速く安く見えても、レビューで落ち続ける完成素材には向きません。

切り替え前に小さな証明テストを走らせる

本番ルートを変える前に、短いが厳密なテストを用意します。Flash には簡単な prompt、Pro には難しい prompt を渡すような比較は意味がありません。同じ prompt、同じ参照画像、同じ比率、同じ解像度、同じ合格基準で比較します。

最低限、文字入りボード、商品画像、参照画像編集、レイアウトまたは情報図、4K キービジュアルの五種類を用意します。それぞれで指示追従、文字正確性、参照保持、構図安定性、局所的な破綻、リトライ数、手直し時間、採用できた出力のコストを記録します。

テスト種類	見える問題
文字入りボード	誤字、句読点、反復語、ラベル位置、階層、整列。
商品画像	質感、光、形状、ブランド安全性、物体の一貫性。
参照編集	元画像の同一性を保つか、新しい場面を作り直してしまうか。
レイアウト・情報図	分割、グループ、順序、ラベル、視覚階層。
4K キービジュアル	拡大時のディテール、アーティファクト、完成利用の安定性。

OpenAI と Google の大きなルート比較なら GPT Image 2 と Nano Banana Pro の比較を別に読みます。高解像度の仕組みだけを知りたい場合は Gemini 4K 画像生成 API に分けます。すでに Pro を選び、失敗対応が必要なら Nano Banana Pro のトラブルシュートに進みます。

API、アプリ、第三者ラッパーを混ぜない

Gemini API の価格表は、Gemini アプリ、AI Studio、Cloud または Vertex、第三者ラッパーのすべてを説明するものではありません。枠、地域、プロジェクト課金、失敗時の課金、プライバシー、ログ、サポート経路は別契約になることがあります。モデル比較では公式 ID と能力境界を決め、利用面の契約は別に確認します。

境界	確認すること
公式 API	model ID、価格単位、Free Tier 状態、出力単位、レスポンス、安全とデータ条件。
AI Studio やテスト UI	そこでの挙動がデプロイ API と同じ前提で扱えるか。
Cloud または Vertex	地域、クォータ、プロジェクト課金、企業統制、利用可能モデル。
第三者ラッパー	価格単位、モデル範囲、失敗課金、制限、プライバシー、サポート、fallback。

この比較では特定のプロバイダー経路を推奨しません。価格、速度、安定性、失敗時の扱い、利用範囲を現在の証拠で確認していないためです。まず公式のモデルルートを決め、その後で接続の便利さを別判断にします。

よくある質問

Nano Banana Pro は Nano Banana 2 より常に良いですか？

常に良いわけではありません。Pro は文字、複雑な構図、参照忠実度、重要な 4K、失敗コストが重い仕事で有利です。Flash は高頻度、反復、量産、コスト重視の仕事で最初に試す価値があります。

preview のモデル ID はまだ使うべきですか？

現在使うプラットフォームが今日も明記している場合を除き、新規実装では gemini-3.1-flash-image と gemini-3-pro-image を出発点にします。preview 表記は移行の手掛かりです。

Nano Banana 2 と Nano Banana Pro はどの API ID に対応しますか？

この API ルート判断では、Nano Banana 2 を gemini-3.1-flash-image、Nano Banana Pro を gemini-3-pro-image に対応させます。ただし UI 表示名ではなく model フィールドを確認します。

Flash は 4K に対応しますか？

現在の公式情報では Flash 側にも 4K preview 関連の行と価格例があります。とはいえ、完成品質や文字、構図、ブランド一致性が重い 4K では Pro が適する場合があります。

Gemini API でこの二つは無料ですか？

2026年6月21日時点の Gemini API 価格表では、どちらにも Free Tier は表示されていません。アプリ、テスト枠、クレジット、ラッパーは別に確認します。

本番を Flash から Pro に切り替えるタイミングは？

同一条件のテストで Flash が合格基準を満たせず、Pro が採用コスト、レビュー時間、リスクを下げると確認できたときです。Flash が十分に通るなら、Pro は必要な仕事だけに使います。