多数 Google 图像 API 任务应该先从 Gemini 3.1 Flash Image 开始,而不是直接把 Gemini 3 Pro Image 当作默认答案。当前要写进请求里的模型 ID 是 gemini-3.1-flash-image 和 gemini-3-pro-image;前者对应 Nano Banana 2,适合作为高频、批量、迭代型图像生成与编辑的起点,后者对应 Nano Banana Pro,更适合文字密集、构图复杂、参考图一致性严格或失败代价很高的成品资产。
截至 2026-05-30,Google 的 Gemini API 价格表对这两个图像路线都显示没有 Free Tier。Flash 的 4K 示例价格更低,Pro 的 4K 示例价格更高,但路由选择不能只看一次生成的标价。真正要算的是“通过验收的产出”成本:重试、局部修图、人工审核、交付延迟和品牌风险都要放进同一个账本。
直接规则:日常批量图、营销草稿、商品图探索、内部创意评审、提示词调试和成本敏感任务先用 Flash。海报字版、包装稿、信息图、品牌模板、多语种文字、复杂参考图编辑、关键 4K 视觉和交付失败会带来额外人力成本的任务,再考虑 Pro。
停止规则:不要因为 Pro 听起来更高级就把生产流量整体切过去。先用同一组提示词、同一批参考图、同一比例、同一分辨率和同一验收标准同时测试两个模型,再比较每个通过验收结果的总成本。
先把当前模型 ID 对齐
这次比较的第一步不是判断谁“更好看”,而是确认代码里应该调用哪个模型。当前官方文档和价格页使用的是 gemini-3.1-flash-image 与 gemini-3-pro-image。如果你在旧文章、旧示例、第三方面板或历史代码里看到 gemini-3.1-flash-image-preview、gemini-3-pro-image-preview 之类字符串,要先把它们当作迁移线索,而不是默认复制到新项目里的当前合约。

这个 ID 边界很重要,因为 Gemini 家族名很容易被缩短。gemini-3-pro-image 是 Pro 图像端点,不等于任意 Gemini Pro 文本模型;gemini-3.1-flash-image 是 Flash 图像端点,也不是普通 Flash 文本路由。文章、SDK 示例、日志或供应商后台只写“Gemini Pro”或“Flash”时,应该追问实际 model 字段。
| 市场名称 | 当前 API 模型 ID | 实际角色 |
|---|---|---|
| Nano Banana 2 | gemini-3.1-flash-image | 默认图像路线,适合高频、迭代、批量和成本敏感工作。 |
| Nano Banana Pro | gemini-3-pro-image | 精度升级路线,适合复杂构图、文字密集、参考图一致性和成品交付。 |
| 旧 Flash preview 示例 | 多见于 gemini-3.1-flash-image-preview 一类写法 | 只当迁移线索,除非你正在使用的平台今天仍明确要求该字符串。 |
| 旧 Pro preview 示例 | 多见于 gemini-3-pro-image-preview 一类写法 | 只当历史示例,不能替代当前官方模型 ID。 |
API 路由、AI Studio 测试界面、Gemini App、Vertex 或第三方包装层可能有不同的额度、区域、计费单位和请求格式。模型 ID 只是路由记录里的一个字段,不应该把官方 API 价格、应用端体验和供应商套餐混在同一张表里。
默认路线是 Flash,不是低配妥协
Gemini 3.1 Flash Image 应该先被测试,是因为它的定位就是速度和高频使用,而不是因为它只能做草稿。对于需要大量变体、快速评审、反复调提示词、内部试图、商品图探索和社媒素材批量生成的场景,一次失败的代价通常不高。你本来就会生成多张图、比较多个方向、改几次提示词,这时候较低的原始输出成本和更快的迭代节奏往往比单张最高精度更有价值。
Flash 的正确使用方式不是“便宜所以随便跑”,而是“先证明它能不能过真实验收线”。如果短文字、简单布局、常规产品图、轻量编辑和多版本探索已经能在可接受的重试次数内交付,继续用 Flash 才是稳妥的生产决策。只有当失败模式开始稳定出现,才需要引入 Pro 做对照。
| 工作负载信号 | 为什么 Flash 往往先上 |
|---|---|
| 需要很多变体 | 迭代本来就是流程的一部分,较低的原始输出价格更重要。 |
| 输出只用于内部评审 | 小瑕疵可以接受、重跑或作为方向草图,不会直接伤害品牌。 |
| 文字很短或不是核心 | Pro 的文字与布局优势不一定改变最终交付质量。 |
| 参考图一致性有帮助但不是硬指标 | 接近即可用于探索、提案或前期沟通。 |
| 4K 不是唯一交付目标 | Flash 也有高分辨率路线,是否用 Pro 取决于成品风险。 |
如果 Flash 在同一验收标准下通过,保留 Flash 做默认路线。不要用别人的单张样例替代你自己的验收记录。每个团队的失败成本不同:电商封面、菜单板、包装字稿、长文字信息图和品牌人物模板的失败代价,和内部脑暴图完全不是同一个量级。
Pro 是精度和失败成本的升级路线
Gemini 3 Pro Image 更适合承担“失败很贵”的任务。这里的贵不一定只是模型价格,而是重做、修字、排版、客户审核、法律审查、设计师返工、上线延误和品牌风险。一个菜单价格写错、包装标签漂移、参考人物五官走样、产品材质变形或 4K 主视觉有明显瑕疵,都可能让低价生成变成高价返工。
Pro 更值得提前测试的任务,通常有明确的成品压力。比如密集文字海报、信息图、产品发布主视觉、包装 mockup、品牌模板、演示稿封面、多语种素材、复杂场景分区、参考图编辑和需要高保真的电商图。如果这些图必须一次进入客户或管理层审查,减少失败次数往往比降低单次生成价格更关键。
| Pro 触发条件 | 要实际记录什么 |
|---|---|
| 文字密集或标签多 | 拼写、标点、重复词、层级、对齐和位置错误。 |
| 构图复杂 | 多区域结构是否稳定,元素是否按要求分组。 |
| 参考图一致性重要 | 物体身份、姿态、材质、品牌形状和背景限制是否保留。 |
| 4K 成品资产 | 细节稳定性、局部伪影、字版清晰度和最终可用度。 |
| 失败成本高 | 人工修图时间、审核延迟、重新交付和机会成本。 |
如果这些触发条件不存在,Pro 可以作为抽样对照,但不应该直接取代 Flash。路线选择的核心不是“哪一个模型更高级”,而是“哪一个模型在我的验收线下更便宜、更稳、更少打断工作流”。
价格要按通过验收的产出计算
截至 2026-05-30,Google Gemini API 价格表对 gemini-3.1-flash-image 列出的标准输入价格是每百万 text/image tokens 0.50 美元,图像输出价格是每百万 output tokens 60 美元,示例图像价格包括 0.5K 为 0.045 美元、1K 为 0.067 美元、2K 为 0.101 美元、4K 为 0.151 美元。对 gemini-3-pro-image,标准输入价格为每百万 text/image tokens 2 美元,图像输出价格为每百万 output tokens 120 美元,示例价格为 1K 或 2K 0.134 美元、4K 0.24 美元。

这些数字只回答了“生成一次大约多少钱”,不能直接回答“最终交付哪条路更省”。如果 Flash 4K 一次 0.151 美元,两次就能通过,它通常比 Pro 4K 0.24 美元更合适。如果 Flash 五次仍然要人工修字、修构图、重做参考图一致性,那么 Pro 一次或两次通过反而可能更便宜。
| 指标 | 记录方式 |
|---|---|
| 已生成数量 | 每一次付费生成都计入,不只记录最后保留的那张。 |
| 通过验收数量 | 只数真正能进入交付、发布或客户评审的资产。 |
| 修正成本 | 估算人工修图、文字修正、排版、二次生成和审核等待时间。 |
| 通过验收成本 | (模型费用 + 修正成本) / 通过验收数量。 |
| 切换阈值 | 只有当 Pro 降低通过验收成本或明显降低不可接受风险时才切换。 |
Batch 或 Flex 价格可能影响某些离线生产场景,但它们改变的是作业模式和延迟条件。实时交互、在线编辑、用户等待和内部快速评审,不能直接把批处理价格拿来当同一个成本模型。
能力差异要放回任务里看
两个图像路线都有图像生成、图像编辑、高分辨率输出、文字渲染、搜索 grounding、thinking 和多参考图等能力语境。差异不是“谁拥有全部能力”,而是你当前任务最害怕哪种失败。Flash 的输入上限更大,官方模型详情页列出 131,072 input tokens、32,768 output tokens,并包含 text/images/video preview input。Pro 的输入上限是 65,536,output limit 同为 32,768,定位更偏专业资产生产。
| 能力项 | Gemini 3.1 Flash Image | Gemini 3 Pro Image | 路由影响 |
|---|---|---|---|
| 官方角色 | 速度和高频图像使用 | 专业资产生产 | 先从 Flash 证明,再为精度升级。 |
| 当前模型 ID | gemini-3.1-flash-image | gemini-3-pro-image | 代码中使用完整 image ID。 |
| 输入上限 | 131,072 tokens | 65,536 tokens | 更大输入不等于更高成品精度,但对宽上下文有用。 |
| 输出上限 | 32,768 tokens | 32,768 tokens | 不是主要差异。 |
| 分辨率行 | 512、1K、2K、4K preview | 1K、2K、4K preview | 4K 不是 Pro 独占;成品风险决定是否升级。 |
| 视频输入 | Flash 页面列出 video input preview | Pro 页面没有同样列法 | 视频到图像实验可能先看 Flash。 |
| 文字和布局 | 支持 | 更适合高精度交付 | 文字密集、版式严格时优先测试 Pro。 |
最容易犯的错,是把表格中的某个优势当作总冠军奖杯。一个路线在文字密集海报上更稳,不代表它在大量轻量变体上更经济;一个路线在批量图上更快,也不代表它适合品牌关键物料。价格、延迟、上下文、审核成本和交付风险必须一起判断。
切换前跑一个小型证明
切换路线前的验证应该小而严格。不要把 Flash 跑简单 prompt、Pro 跑复杂 prompt;不要换参考图、换比例、换输出尺寸或换验收标准。你要比较的是模型路线,不是两个不同任务。最小测试集应该覆盖你的真实失败模式,而不是只挑最好看的样例。

建议至少准备五类提示词:密集文字板、产品图、参考图编辑、信息图或多区域布局、4K 主视觉。每一类都用同一份 prompt、同一批参考图、同一比例和同一质量规则跑 Flash 与 Pro,然后记录每次输出的指令跟随、文字准确性、参考图保留、构图稳定性、局部伪影、重试次数和人工修正时间。
| 测试族 | 暴露的问题 |
|---|---|
| 密集文字板 | 拼写、标点、重复词、标签位置、层级和对齐。 |
| 产品图 | 真实性、材质、光照、品牌安全细节和物体一致性。 |
| 参考图编辑 | 是否保留源图身份,而不是重新发明场景。 |
| 布局或信息图 | 分组、顺序、空间关系、标签对齐和视觉层级。 |
| 4K 主视觉 | 局部细节、放大后的伪影、文字清晰度和最终可用性。 |
如果你的问题其实是 OpenAI 与 Google 路线怎么选,可以看 GPT Image 2 与 Nano Banana Pro 对比。如果你只关心高分辨率输出机制,用 Gemini 4K 图像生成 API 单独处理。已经选择 Pro 但遇到失败时,再进入 Nano Banana Pro 故障排查,不要在比较文章里把问题混成模型总评。
API、应用和第三方包装要分开
Gemini API 价格表不能直接代表所有使用入口。Gemini App、AI Studio、Google Cloud 或 Vertex 表面、企业项目、第三方包装层和内部网关都可能有不同的额度、区域、计费、失败扣费、隐私条款、日志保留和支持路径。模型比较文章能给出的,是官方模型 ID、能力边界、价格单位和验证方法;具体供应商路线需要单独验证。
| 边界 | 上线前要确认 |
|---|---|
| 官方 API | model ID、价格单位、Free Tier 状态、输出单位、响应结构、安全与数据条款。 |
| AI Studio 或测试 UI | prompt 行为是否能代表部署 API。 |
| Cloud 或 Vertex 表面 | 区域、项目计费、企业控制、额度和可用模型。 |
| 第三方包装 | 价格单位、模型覆盖、失败扣费、限额、隐私、支持路径和 fallback 行为。 |
本文不推荐任何供应商路线,因为这个比较没有验证第三方价格、速度、稳定性、失败不扣费或服务范围。先把官方模型路线选清楚,再决定是否为了接入便利使用网关。不要把商业入口隐藏在官方 API 表格里。
常见问题
Gemini 3 Pro Image 一定比 Gemini 3.1 Flash Image 好吗?
不是。Pro 更适合文字密集、复杂构图、参考一致性、关键 4K 成品和失败成本高的任务。Flash 更适合作为大多数高频、迭代、批量和成本敏感图像任务的起点。真正的判断标准是通过验收成本和风险,而不是模型名字的高级感。
现在还应该用 preview 模型 ID 吗?
除非你正在使用的平台今天明确要求 preview 字符串,否则新项目应该优先使用当前官方模型 ID:gemini-3.1-flash-image 和 gemini-3-pro-image。旧 preview ID 可以帮助你理解历史代码和旧示例,但不应成为新代码的默认合约。
Nano Banana 2 是 Gemini 3.1 Flash Image 吗?
在这个 API 路由决策里,可以这样映射:Nano Banana 2 对应 gemini-3.1-flash-image,Nano Banana Pro 对应 gemini-3-pro-image。但仍然要在代码、日志和供应商后台里核对完整 model 字段,避免把文本模型、应用入口或旧 preview 示例混在一起。
Flash 支持 4K 吗?
当前官方模型详情和价格信息中,Flash 有 4K preview 相关行,也有 4K 示例价格。Pro 仍可能在高质量 4K 成品、复杂文字和品牌一致性上更合适,但 4K 支持本身不是 Pro 独占理由。
这两个图像模型在 Gemini API 里免费吗?
截至 2026-05-30,Google 的 Gemini API 价格表对两个当前图像路线都显示没有 Free Tier。应用端体验、测试额度、赠金或第三方包装可能不同,但那些都需要单独验证,不能从 API 价格表反推。
什么时候把生产流量从 Flash 切到 Pro?
只有当同一组 prompt 证明 Flash 不能稳定达到你的验收标准,而 Pro 能减少重试、修图、审核延迟或不可接受风险时,才应该切换。若 Flash 用可接受的重试次数通过,就把 Pro 留给真正需要精度升级的任务。



