OpenAI 模型路线图：GPT-5.5、GPT Image 2、Codex、Realtime、Audio 与 Sora 2

截至 2026-05-08，GPT-5.5 Pro、GPT-5.5 Instant、GPT Image 2、GPT-5.3-Codex、gpt-realtime-1.5、gpt-audio-1.5、Sora 2 和 Sora 2 Pro 都不能放进同一个“模型列表”里直接选择。正确顺序是先判断任务入口，再看可调用的公开名称，最后才决定是否需要更强、更快或更贵的路线。

最短答案是：ChatGPT 用户先看 GPT-5.5 Instant；API 推理先看 gpt-5.5 或 gpt-5.5-pro；图片生成和编辑先看 gpt-image-2；代码代理先看 Codex 暴露的模型；低延迟语音先看 gpt-realtime-1.5；普通音频任务先看 gpt-audio-1.5；Sora 2 / Sora 2 Pro 先分清应用入口和 legacy Videos API 停用风险。

当前任务	先打开的入口	名称或 ID	容易踩错的点
只想用 ChatGPT 默认体验	ChatGPT	GPT-5.5 Instant	它是产品显示名，不是默认可复制的 API ID
做后端推理或 agent API	OpenAI API	`gpt-5.5` / `gpt-5.5-pro`	Pro 可能带来更长响应和后台处理预期
生成或编辑图片	Images API / 图片工作流	`gpt-image-2`	不要用 GPT-5.5 表格回答图片限额和价格
做代码代理或仓库任务	Codex	`gpt-5.3-codex` 或 Codex 暴露的 GPT-5.5	Codex 登录方式会影响可选模型
做实时语音产品	Realtime API	`gpt-realtime-1.5`	实时会话和普通音频请求不是一个接口
做音频输入输出任务	Chat Completions audio	`gpt-audio-1.5`	适合请求/响应式音频，不等于低延迟会话
做 Sora 视频	Sora 应用或 legacy Videos API	`sora-2` / `sora-2-pro`	先确认 Videos API 2026-09-24 停用边界

上线前还要加一道停止规则：凡是涉及价格、免费额度、地区、账号权限、限速、失败计费、第三方平台覆盖、Sora API 状态或 Codex 可选模型，都不能靠旧笔记和社交截图确认。它们属于会变的事实，必须在真正接入当天重新打开官方页面或控制台。

GPT-5.5：Instant、API、Pro 不是同一个调用名

GPT-5.5 最容易被用错，因为 ChatGPT 产品面和开发者 API 面现在使用了相近但不等价的名称。GPT-5.5 Instant 是 ChatGPT 的默认体验标签，面向的是用户在模型选择器或默认对话里的感受。它告诉你 ChatGPT 当前走的是更快、更个性化的默认路线，但不等于你可以把 gpt-5.5-instant 当作稳定 API ID 写进服务。

开发者实现要回到 OpenAI API 的公开模型页面。当前更安全的写法是把 gpt-5.5 和 gpt-5.5-pro 视作 API 推理路线，把 chat-latest 视作 Instant 公告里提到的 ChatGPT 相关 API 路径，而不是把产品显示名、系统卡内部名和代码里的模型参数混在一起。

GPT-5.5 Pro 也不是“无脑更好”。Pro 更适合难推理、复杂分析、长任务和高价值请求，但它可能带来更长延迟、更高成本和后台模式需求。产品如果只是普通问答、轻量抽取或批量低成本任务，应该先把任务样例、响应时间、预算和失败策略写清楚，再决定是否上 Pro。

一个实用检查是：如果问题来自 ChatGPT 界面，先查账号、套餐、灰度和模型选择器；如果问题来自 API 报错，先查模型 ID、endpoint、组织权限、billing、请求体和当前模型可用性。两类问题的排查入口不同，混用名称会让团队在错误的地方找原因。

使用面分流：先选产品层，再选模型名

同一个 OpenAI 名称，在不同产品层里承担的责任不同。ChatGPT 负责应用体验，OpenAI API 负责后端调用，Codex 负责代码代理工作流，Images API 负责图片输出，Realtime 负责低延迟语音会话，Chat Completions audio 负责请求/响应式音频任务，Sora 负责视频创作体验和历史 API 边界。

OpenAI 使用面分流图，按任务、入口和模型名称拆开

这张分流思路可以避免三种常见误判。第一，把 ChatGPT 模型名当成 API 参数；第二，把图片模型当成通用推理模型比较；第三，把 Sora 应用可用误读成新的长期后端 API 路线。每一种误判都会让排查路径错位，最后看起来像模型不可用，实际是入口选错了。

产品评审时可以把需求改写成一句入口问题：我要让用户聊天、让后端推理、让代理改代码、让系统生成图片、让语音实时互动、让服务处理音频，还是让创作者生成视频？这句话比“哪个模型最强”更接近上线决策。

开发者模型 ID：写代码前先确认公开名称

写代码时只认当前公开文档暴露的模型 ID。GPT-5.5、GPT Image 2、Codex、Realtime、Audio 和 Sora 不是一个扁平菜单，而是多个接口面上的名称集合。公开 ID 决定请求参数，产品标签只帮助人理解入口。

OpenAI 开发者模型 ID 对照表，避免把产品名当成调用名

名称	开发者安全解释	上线前重查
GPT-5.5 Instant	ChatGPT 默认体验和 `chat-latest` 相关入口	不要写成 `gpt-5.5-instant` 后直接放进生产调用
GPT-5.5 Pro	`gpt-5.5-pro` API 模型和 ChatGPT Pro 模式都要看各自入口	慢请求、后台模式和成本预期要提前确认
GPT Image 2	`gpt-image-2`	图片生成、编辑、价格和限额不能由 GPT-5.5 表格代替
GPT-5.3-Codex	Codex 编码路线	Codex 模型选择还受登录、API key、本地 CLI 和云任务影响
Realtime 1.5	`gpt-realtime-1.5`	适合低延迟语音会话，不等于普通音频请求
Audio 1.5	`gpt-audio-1.5`	适合 Chat Completions 的音频输入输出任务
Sora 2 / Sora 2 Pro	`sora-2`、`sora-2-pro` 与 Sora 应用	API 页面是 legacy，Videos API 停用日期要先看清

复制模型 ID 前还要看 endpoint。gpt-image-2 属于图片生成和编辑路线；gpt-realtime-1.5 属于实时会话；gpt-audio-1.5 属于 Chat Completions 的音频任务；sora-2 和 sora-2-pro 即使出现在模型页面，也必须和 legacy 标签及停用说明一起看。

这也是为什么“OpenAI 最新模型对比”不能只给一张能力排行。对后端工程来说，真正的表格至少要有入口、模型 ID、请求形态、是否适合后台任务、是否适合流式会话、是否有停用风险、是否涉及价格或限额重查。

Codex：代码模型要按 Codex 路线判断

Codex 不是普通 API 模型列表的镜像。一个模型在 API 文档里可见，并不自动证明它在 Codex CLI、本地 IDE、云任务、ChatGPT 登录或 API key 模式里都以同样方式可用。代码代理的关键问题还包括它能不能读仓库、能不能控制补丁范围、能不能理解测试失败，以及能不能在不改无关文件的情况下完成任务。

如果 Codex 暴露 GPT-5.5，复杂代码任务可以优先试它；如果当前路线更适合 Codex 专用模型，就继续把 gpt-5.3-codex 作为重要选项。选择时不要只看模型发布日期，而要看当前 Codex 入口、认证方式、任务难度、上下文量、成本和失败恢复策略。

代码场景的测试样例也要不同。通用聊天评测不能证明一个模型能改真实仓库。更有价值的是小 bug 修复、带约束重构、失败测试定位、API 接入、代码 review 和文档同步任务。模型能在这些任务里给出小而准的补丁，才更接近 Codex 价值。

GPT Image 2：产品名、模型 ID、工作流要分开

GPT Image 2 的开发者 ID 是 gpt-image-2，这比 GPT-5.5 Instant 清晰，但仍不能忽略工作流差异。直接调用 Images API、在 Responses 工作流里组合文本推理和图片输出、做图片编辑、做多图一致性，都是不同的工程设计。模型名相同，不代表提示、输入文件、输出格式、成本和错误处理都相同。

图片相关问题变化更快，尤其是免费额度、使用限制、单张成本、4K 输出、第三方入口和失败计费。模型路线图只需要告诉读者“图片任务先看 gpt-image-2”，不应该在没有重新核验的情况下写死价格和承诺。

如果只是想测试浏览器图片体验，可以走产品入口；如果要在后端批量生成或编辑图片，就看 API 文档、请求格式、文件处理和账号权限；如果要比较供应商，必须把官方事实和平台自己的路由、重试、计费、数据条款分开记录。

Realtime 1.5 与 Audio 1.5：实时会话不是普通音频任务

gpt-realtime-1.5 和 gpt-audio-1.5 都和音频有关，但接口思路不同。Realtime 适合低延迟语音代理、实时打断、流式会话和连续互动；Audio 1.5 更适合请求/响应式的音频输入输出任务，例如一次性理解音频、生成音频回复或把音频步骤嵌入后端流程。

选择时先看用户体验是否要求“正在说话时就能响应”。如果是，就从 Realtime 开始评估连接、会话状态、延迟、打断、音频格式和流式错误恢复。如果只是一个后端任务，Audio 1.5 往往更简单，也更容易纳入普通队列、日志和重试系统。

旧的 realtime 或 audio preview 名称不要直接沿用。音频接口更新快，停用页面会影响老代码能否继续运行。迁移前至少检查模型名、endpoint、认证方式、音频格式、流式能力和当前停用说明。

Sora 2 与 Sora 2 Pro：先看应用入口，再看 API 停用风险

Sora 是整组名称里最需要醒目标注的边界。Sora 应用或网页入口说明的是创作者能不能使用视频产品；sora-2 和 sora-2-pro 出现在 API 模型页面时，还要看页面是否标为 legacy，以及 Videos API 是否已经进入停用计划。OpenAI deprecations 页面列出的 Videos API shutdown date 是 2026-09-24，这个日期必须和任何 API 建设计划放在一起看。

Sora 2 状态边界图，区分应用入口和 legacy Videos API 停用日期

这不等于 Sora 没有 API，也不等于能打开 Sora 应用就能放心做新的后端集成。消费级视频创作、内部演示、自动化视频生产和长期 API 产品是不同决策。只要涉及生产代码，就要先问：当前支持的构建路径是什么，legacy API 还能用多久，迁移路径在哪里，失败时是否有替代方案。

如果任务只是理解 Sora 2 和 Sora 2 Pro 的能力差异，可以先看应用与帮助文档；如果任务是接入后端视频生成，则停用状态、账号权限、地区、配额、成本和输出权利必须在同一天核验。Sora 的错误边界比普通聊天模型更容易造成返工。

应该先选哪一个 OpenAI 模型？

把任务写成一句话后，选择会清楚很多。聊天产品或后端 agent 先看 GPT-5.5 API 路线；普通 ChatGPT 使用先看 Instant；复杂高价值请求再看 Pro；图片先看 GPT Image 2；代码代理先看 Codex；实时语音先看 Realtime；音频任务先看 Audio；视频创作先看 Sora 应用，视频 API 构建先看 legacy 与停用说明。

如果你要做	第一入口	为什么
ChatGPT 默认体验	GPT-5.5 Instant	它是用户可见的产品路线
后端推理或复杂 agent	`gpt-5.5` / `gpt-5.5-pro`	这些是 API 推理模型 ID
仓库修改或代码代理	Codex	模型可用性和认证方式会影响结果
图片生成或编辑	`gpt-image-2`	图片模型拥有自己的接口和限制
实时语音	`gpt-realtime-1.5`	低延迟会话需要专门接口
普通音频任务	`gpt-audio-1.5`	请求/响应式音频更适合它
Sora 视频	Sora 应用；API 先看停用状态	应用和 legacy API 不能互相证明

最后的生产建议是保守的：能用官方文档确认的，只写官方文档能支持的；不能确认的，不要把它写成可用承诺。新模型名称很诱人，但上线失败通常不是因为没有追最新，而是因为把产品名、API ID、接口形态和停用状态混成了一句话。

常见问题

GPT-5.5 Instant 是 API 模型 ID 吗？

不要这样用。把 GPT-5.5 Instant 当成 ChatGPT 默认体验标签；API 调用应查看 chat-latest、gpt-5.5 或 gpt-5.5-pro 等公开文档给出的当前路线。

GPT-5.5 Pro 适合所有任务吗？

不适合。它更适合复杂推理、长任务和高价值请求，但可能带来更高成本、更长等待和后台处理需求。普通任务先用明确样例比较再决定。

GPT Image 2 和 ChatGPT Images 2.0 是一回事吗？

不是同一层。GPT Image 2 更接近模型/API 说法，开发者 ID 是 gpt-image-2；ChatGPT Images 2.0 是产品体验入口。

Codex 里应该用 GPT-5.5 还是 GPT-5.3-Codex？

先看当前 Codex 入口暴露什么模型，再看任务难度。复杂通用推理可试 GPT-5.5，代码代理专项任务仍要把 gpt-5.3-codex 当作重要路线。

gpt-realtime-1.5 和 gpt-audio-1.5 怎么选？

需要实时语音会话、打断和低延迟互动时选 Realtime；只需要一次请求处理音频输入或输出时选 Audio 1.5。

Sora 2 能直接做 API 产品吗？

只能在当前停用状态和支持路径确认后再决定。Sora 2 / Sora 2 Pro 的模型页面有 legacy 边界，Videos API 停用日期需要先检查。

OpenAI 模型路线图：GPT-5.5、GPT Image 2、Codex、Realtime、Audio 与 Sora 2

文章目录

OpenAI 模型路线图：GPT-5.5、GPT Image 2、Codex、Realtime、Audio 与 Sora 2

GPT-5.5：Instant、API、Pro 不是同一个调用名

使用面分流：先选产品层，再选模型名

开发者模型 ID：写代码前先确认公开名称

Codex：代码模型要按 Codex 路线判断

GPT Image 2：产品名、模型 ID、工作流要分开

Realtime 1.5 与 Audio 1.5：实时会话不是普通音频任务

Sora 2 与 Sora 2 Pro：先看应用入口，再看 API 停用风险

应该先选哪一个 OpenAI 模型？

常见问题

GPT-5.5 Instant 是 API 模型 ID 吗？

GPT-5.5 Pro 适合所有任务吗？

GPT Image 2 和 ChatGPT Images 2.0 是一回事吗？

Codex 里应该用 GPT-5.5 还是 GPT-5.3-Codex？

gpt-realtime-1.5 和 gpt-audio-1.5 怎么选？

Sora 2 能直接做 API 产品吗？

文章标签

分享这篇文章

相关文章

Imagen 4 vs Nano Banana：2026 年 Imagen 退役前该选哪条路线

Nano Banana 文生视频怎么免费试：Google Vids、Veo API 与第三方站点核验

Gemini 一直 Loading Nano Banana？先分清入口再重试