Grok 4.3、Grok 4.20、Imagine 和 Voice 怎么选：xAI 模型与 API 路线图

现在要接入 Grok，先把问题拆成路线，而不是先比较版本号。普通文本、迁移旧模型、结构化抽取、客服自动化和 RAG 回答，优先从 Grok 4.3 开始；只有当任务明确需要 4.20 的推理分支、非推理分支、2M 上下文、provider 别名或多智能体协作时，再把 Grok 4.20 放进评估。Grok Imagine 和 Grok Voice 属于图像/视频与语音接口家族，不是 Grok 4.3 或 4.20 的模式开关。

路线	适用场景	必须核对	主要风险
Grok 4.3	新建或迁移文本 API，默认先测它	xAI 模型页、别名、reasoning effort、上下文、价格	价格、上下文和可用性都必须按日期复核
Grok 4.20 reasoning / non-reasoning	需要 2M 上下文、深推理、低延迟直答或 provider 已选定 4.20	xAI 或 provider 的模型 ID 与模式说明	不能把每个 4.20 标签当成 4.3 的统一替代
Grok 4.20 multi-agent	任务有并行研究、工具调用、复杂代码或多路径判断	Responses API、多智能体数量、工具和计费	主智能体、子智能体和工具调用都会改变成本面
Grok Imagine	图像生成、视频生成、批量媒体产出	imagine image/video 模型、端点、质量、时长、分辨率	它是媒体路线，不是文本模型升级
Grok Voice	实时语音、TTS、STT、自定义声音或语音代理	realtime、TTS、STT、Voice Agent、Custom Voices 文档	语音有独立端点、延迟和价格面
Provider 接入	已经在 Vercel、Oracle、OpenRouter 等网关内交付	provider 模型名、区域、限额、价格、数据策略	provider 能证明自己的路线，不能自动证明 xAI 一方可用

停止线：还没确认路线归属、端点家族、计费面、生命周期和回滚方案之前，不要直接把配置切到多智能体或 provider 别名。图像/视频需求直接核对 Imagine；语音需求直接核对 Voice；文本需求才回到 Grok 4.3 与 4.20 的选择。

中文团队尤其要避免把“海外文档里的模型名”“provider 控制台里的别名”和“社交媒体里的版本号讨论”混成同一条采购结论。更稳妥的做法是先写一张内部路线卡：谁是合同所有者，哪个端点接收请求，是否需要 reasoning effort，是否走 Responses API，是否产生临时媒体文件，是否有语音会话状态，以及上线前由谁复核价格和限额。这样讨论 Grok 4.3、Grok 4.20、Imagine 和 Voice 时，团队对齐的是交付边界，而不是单纯追一个看起来更新的名称。

先选路线，再看版本号

Grok 相关名称现在同时覆盖五类合同：xAI 一方文本模型、4.20 的专门分支、多智能体编排、图像/视频生成、语音实时接口，以及 provider 打包后的模型名。如果把它们排成一个简单版本梯子，最容易犯的错就是看见 4.20、multi-agent、Imagine 或 Voice 就以为都能替代同一个聊天模型。实际落地时，第一步应该是判断任务所有者：文本模型、媒体接口、语音接口、provider 网关，还是多智能体工作流。

2026年5月8日核对的 xAI 文档中，Grok 4.3 模型页列出 Grok 4.3、grok-4.3-latest 和 grok-latest 等名称，并支持 none、low、medium、high 等 reasoning effort 设置。xAI 的 5月15日退休迁移说明也把多个旧 Grok 4、Grok 3、reasoning、non-reasoning 和 coding 模型的替代路线指向 Grok 4.3。对大多数新项目或迁移项目，这已经足够说明 Grok 4.3 应该先进入测试，而不是先追逐更复杂的 4.20 分支。

Grok 4.3、Grok 4.20、Imagine 和 Voice 的模型 ID 与迁移关系图

Grok 4.20 仍然有位置，但它的位置是专门路线，而不是全局默认。xAI 的 Grok 4.20 reasoning 页面写明 2M 上下文和 reasoning 能力；Vercel、Oracle 等 provider 也会展示 4.20 的 reasoning、non-reasoning 或 multi-agent 变体。这些证据说明 4.20 不是不存在，而是必须先问清楚：你的应用是否真的需要这条路线，还是只是被一个更醒目的名字带偏。

Grok 4.3 什么时候应该先测

只要任务是普通文本 API 集成，Grok 4.3 就是更干净的起点。客服问答、摘要、分类、信息抽取、RAG 回答、文案辅助、工作流自动化、旧模型迁移，都更需要一个当前一方文档清楚、reasoning effort 可控、迁移方向明确的文本合同。先测 Grok 4.3 能减少模型别名、provider 差异和 beta 生命周期带来的额外变量。

一个合格的 Grok 4.3 测试不需要复杂。选定 Grok 4.3 或 grok-4.3-latest，把 reasoning effort 写进请求，使用同一组业务 prompt 跑延迟、可接受输出率、token 用量、拒答行为、错误处理和回滚路径。如果任务没有用到超长上下文、并行研究、媒体生成或语音互动，这组小测试通常比对比所有可见 Grok 名称更快得出答案。

非推理任务也不一定要换模型家族。迁移说明把一些 non-reasoning 工作负载指向 Grok 4.3，并通过 reasoning effort 关闭推理开销。分类、格式转换、轻量总结、固定模板回复等场景，可以先用 Grok 4.3 加 none 推理设置来测。只有当你的部署路线已经由 provider 拥有，并且 provider 明确提供 4.20 non-reasoning 模型时，才需要把那条路线作为单独选择。

价格和上下文要贴着来源使用。2026年5月8日核对时，Grok 4.3 页列出了 1M 上下文和输入/输出 token 价格；这些数字可以作为预算评估依据，但不应该写成长期承诺。生产上线前重新打开 xAI 模型页、Console、限额和状态信息，因为地域、账号、速率限制和可用性都可能改变。

Grok 4.20 什么时候仍然值得保留

Grok 4.20 应该留在决策表中，但只在任务确实需要它时。典型情况包括：需要 2M 上下文做长文分析，需要 reasoning 分支处理复杂逻辑，需要 provider 内已经暴露的 4.20 non-reasoning 直答路线，或者需要已经验证过的 beta 能力。这里的关键不是“4.20 是否更大”，而是“4.20 是否是这次任务的合同所有者”。

Reasoning 分支适合复杂推理、长链分析、研究型回答和代码判断。Oracle 的 OCI 文档把 reasoning 与 non-reasoning 拆成两个模型，并把 reasoning 放在复杂分析场景里。这对 OCI 用户有用，但它首先证明的是 OCI 路线，不等于每个 xAI 一方账号都有同样的可用性、模型名和生命周期。

Non-reasoning 分支更窄。Vercel AI Gateway 页面把 Grok 4.20 Non-Reasoning 描述成 beta 的速度/直答路线，并使用 provider 自己的模型字符串。对已经采用 Vercel AI SDK 或 AI Gateway 的项目，这可能正好减少集成摩擦；对还没有选定 provider 的一方 xAI 项目，它不能替代 Grok 4.3 加 none 推理设置的基础测试。

需求	更稳妥的首测路线	只有在何时升级
当前一方文本 API	Grok 4.3	Grok 4.3 未通过业务验收
低延迟直答	Grok 4.3 关闭推理	provider 已经拥有并文档化 4.20 non-reasoning
超长上下文分析	Grok 4.20 reasoning	真实使用了额外上下文并测过召回质量
网关交付	provider 模型 ID	provider 的价格、限额、区域和数据策略可接受

衡量标准必须是业务任务。2M 上下文不是完美召回的保证；non-reasoning 标签也不自动意味着最低成本；beta 名称更不等于长期生产默认。把同一组请求跑完，再根据可接受答案率、成本、延迟和回滚难度选择。

多智能体是工作负载选择，不是默认升级

Grok 4.20 multi-agent 最容易被过度使用。xAI 的多智能体文档把它定义为 beta 路线，使用多个智能体、内置工具、默认输出 leader 结果，并支持 4-agent 或 16-agent 配置。这对研究、复杂代码、广泛信息收集和工具密集推理有意义；对常规客服、轻量抽取、短回答和固定模板，它通常只会增加验证和成本。

Grok 推理、非推理与多智能体选择看板，强调成本边界

多智能体真正要证明的是总失败成本下降。文档说明 leader、sub-agent token 和服务端工具调用都会计费，所以问题不是“智能体更多是不是更强”，而是“额外智能体是否让错误率、人工复核时间或研究遗漏明显下降”。一个多智能体研究任务如果节省工程师数小时，成本可以接受；把 16-agent 用在简单 FAQ 改写上，就是把复杂度转成账单。

条件	为什么重要
任务天然可拆成并行子问题	多个智能体才有独立工作可做
工具调用或实时研究会改变结论	否则单模型回答更简单
结果有复核或验收流程	生成内容越多，验证越重要
预算能覆盖 leader、sub-agent 和工具	成本面不再等于一次普通 completion

还要检查 API 形状。多智能体属于 Responses API 路线，不一定能直接塞进旧的 chat completions wrapper。监控、日志、重试、成本归因、响应解析和 provider 兼容性都要重测。把它当作“模型字符串替换”通常会在上线后暴露问题。

Imagine 和 Voice 是独立能力路线

Grok Imagine 不是 Grok 4.3 的图像模式。它是图像和视频生成路线，涉及 grok-imagine-image、grok-imagine-video、图像/视频端点、异步轮询、临时媒体链接、质量、时长、分辨率和价格面。2026年5月8日核对的 xAI 图像文档还提示 grok-imagine-image-pro 计划在 2026年5月15日退役，并建议新请求使用质量路线。这个信息只能作为带日期的迁移提醒，不能写成永远有效的产品承诺。

Grok Imagine 与 Grok Voice 能力分流图，展示媒体与音频端点

视频同样属于 Imagine 家族，但实现方式不同。grok-imagine-video 使用异步生成和轮询，输出临时视频 URL，并有时长、分辨率和输入媒体的计费边界。只要需求是生成媒体，就不应该再纠结 Grok 4.3 与 4.20 哪个更“聪明”；应该直接验证媒体端点、质量、时长、分辨率、内容政策、成本和资源保存方式。

Grok Voice 又是另一条路线。Voice 文档覆盖 Voice Agent API、Text to Speech、Speech to Text 和 Custom Voices，实时语音使用不同请求形状和延迟预算。如果产品要做语音代理、实时对话、转录、语音播报或自定义声音，选择问题就是音频端点、时延、会话状态、计费和安全边界，而不是文本模型排行榜。

中文读者还容易把开发者 API 选择和消费端 Grok Imagine 问题混在一起。成人模式可见性、NSFW 边界、免费替代工具、高需求报错，都有不同的处理路线。本文的边界是开发者模型和 API 路由：选择文本、多智能体、媒体、语音或 provider，而不是教消费端绕过功能限制。

Provider 可以有用，但不能替代一方事实

Vercel、Oracle、OpenRouter 等 provider 很有价值，因为它们能把 Grok 模型放进已有 SDK、网关、日志、计费和部署体系里。它们也能解释某个 provider 如何包装 reasoning、non-reasoning 或 multi-agent 变体。但是 provider 页面证明的是 provider 路线：它的模型名、价格、区域、限额、生命周期和 SDK 支持，不自动证明 xAI Console、xAI API 或另一个网关拥有同样条件。

Provider 能证明	Provider 不能证明
它自己暴露某个模型或别名	xAI 一方对所有账号开放同名路线
它当前的价格、网关 ID、区域和 SDK	xAI 一方长期价格、生命周期或上下文
它自己的日志、重试、监控和账单行为	其他 provider 或 xAI Console 的特性一致
现有技术栈内的快速测试路径	beta 名称可以长期作为生产默认

Oracle 文档把 Grok 4.20 的 reasoning 与 non-reasoning 分开，并把 multi-agent 标成 API-only；Vercel AI Gateway 提供自己的模型字符串和 SDK 路线。这些信息都可以引用，但必须把 provider 名字跟在 claim 旁边。复制 provider 的价格或模型名到 xAI 一方配置里，是最常见的错误。

生产检查可以很短：谁拥有路线，模型或端点字符串是什么，价格和限额由谁定义，数据策略和区域在哪里，生命周期说明是否有日期，回滚模型是什么，状态页和账号可用性如何验证。任何一个答案来自 provider，就把 provider 名称保留下来。

当前 Grok 集成检查表

改配置前先写一行路线决策。它能阻止团队把 Grok 4.3、Grok 4.20、Imagine、Voice 和 provider 名称混成一个大开关。

检查项	通过标准
工作负载归属	明确是文本、多智能体、图像/视频、语音或 provider
模型或端点	使用 Grok 4.3、文档化 4.20 变体、Imagine、Voice 或 provider 别名
生命周期风险	旧文本模型和 Imagine 退役信息按当前文档复核
推理设置	非推理工作有明确 setting 或 provider 路线
成本面	token、子智能体、工具、图像、视频、语音或 provider 账单分别归属
可用性证据	xAI 文档、Console、状态页或 provider 文档对应具体 claim
回滚	旧模型、验收样例、阈值和回滚步骤已记录

状态页只能当作时间戳健康信号。xAI Status 可以提示 API、Console、Docs、Grok Web、X 内 Grok、iOS 和 Android 组件是否有事件，但绿色状态不等于你的账号必然有权限。遇到高需求横幅、账号识别或消费端入口问题，应进入专门的故障排查分支，而不是继续改模型名。

常见问题

Grok 4.3 比 Grok 4.20 新吗？

对大多数当前一方文本 API 工作，Grok 4.3 是 xAI 当前模型页和迁移说明指向的首选路线。Grok 4.20 仍存在于 reasoning、non-reasoning、2M 上下文、provider 和多智能体分支中，所以正确答案是按路线判断，不是按数字排序。

Grok 4.3 会完全替代 Grok 4.20 吗？

不会完全替代。Grok 4.3 能覆盖很多新建和迁移文本任务，但 4.20 的推理、非推理、超长上下文、provider 和多智能体分支仍可能是特定任务的所有者。只有验收测试证明需要时才保留 4.20。

新 Grok API 项目应该先用哪个模型？

先用 Grok 4.3，并明确设置 reasoning effort。除非产品需求已经是多智能体研究、图像/视频生成、实时语音或 provider 路线，否则先把基础文本任务跑通，再评估专门分支。

Grok 4.20 multi-agent 什么时候值得用？

当任务能拆成并行子问题、工具调用会改变答案、输出有复核流程、预算能覆盖 leader、子智能体和工具调用时，才值得用多智能体。常规聊天、短问答和简单抽取不应该默认使用。

Grok Imagine 是 Grok 4.3 的一部分吗？

不是。Grok Imagine 是图像和视频生成路线，有自己的模型、端点、质量、时长、分辨率和媒体资产行为。媒体需求直接核对 Imagine 文档，不要把它当成文本模型的开关。

Grok Voice 是文本模型吗？

不是。Grok Voice 是音频能力家族，覆盖实时语音代理、TTS、STT 和自定义声音。语音产品要看实时端点、延迟、会话、价格和音频安全边界。

可以相信 Vercel、Oracle 或 OpenRouter 的 Grok 名称吗？

可以相信它们对自己路线的说明。provider 页面能证明该 provider 的模型别名、价格、SDK 路径或可用性，不能自动证明 xAI 一方或其他 provider 拥有相同条件。

上线前最该复核什么？

复核 xAI 模型文档、Console 权限、迁移说明、Imagine 与 Voice 文档、provider 模型页、价格、速率限制、状态页和账号可用性。所有易变事实都要跟来源和日期绑定。