Para elegir Grok en una integración real, no empieces por el número de versión. Empieza por la ruta que posee el trabajo. Para text API normal, migración desde modelos antiguos, extracción, resumen, RAG, clasificación y automatización, prueba primero Grok 4.3. Lleva Grok 4.20 a la mesa solo cuando el caso necesita reasoning, non-reasoning, contexto de 2M, una ruta provider ya elegida o multi-agent. Grok Imagine y Grok Voice son familias separadas de imagen/video y audio, no modos superiores de un mismo modelo de texto.
| Ruta | Úsala cuando | Verifica | Caveat |
|---|---|---|---|
| Grok 4.3 | Nueva app de text API o migración de modelos antiguos | página de modelos de xAI, aliases, reasoning effort, contexto, precio | precio, contexto y disponibilidad deben revisarse con fecha |
| Grok 4.20 reasoning / non-reasoning | necesitas razonamiento profundo, respuesta directa, 2M context o provider route | model IDs de xAI o provider y modos soportados | no todo label 4.20 reemplaza a 4.3 |
| Grok 4.20 multi-agent | hay investigación paralela, herramientas, coding o decisiones complejas | Responses API, número de agentes, tools, billing | leader, sub-agents y tools cambian el coste |
| Grok Imagine | necesitas generar imagen o video | image/video models, endpoint, quality, duration, resolution | es media route, no text-model mode |
| Grok Voice | necesitas realtime voice, TTS, STT o custom voices | Voice Agent API, realtime, TTS, STT docs | audio tiene endpoint, latencia y precio propios |
| Provider route | ya despliegas con Vercel, Oracle, OpenRouter u otro gateway | model name, región, límites, precio, lifecycle del provider | el provider prueba su contrato, no disponibilidad universal de xAI |
La regla de parada es concreta: no cambies production a multi-agent ni a un alias de provider hasta conocer owner, endpoint family, cost surface, lifecycle, availability y rollback. Si el producto necesita imagen o video, verifica Imagine. Si necesita audio, verifica Voice. Si el trabajo es texto, vuelve a Grok 4.3 y a las ramas 4.20 que el caso justifique.
Primero la ruta, luego el nombre
Los nombres de Grok mezclan contratos diferentes: modelos first-party de texto de xAI, variantes especializadas de Grok 4.20, multi-agent orchestration, generación de imagen/video, realtime voice/audio y modelos empaquetados por providers. Mirarlos como una sola escalera de versiones provoca malas decisiones: el número mayor o el nombre más llamativo parece ganar aunque no sea el dueño del workload. En una integración API importa saber qué ruta posee el trabajo, qué model ID o endpoint exige y quién responde por disponibilidad y precio.
A 8 de mayo de 2026, la página de Grok 4.3 en la documentación de xAI listaba Grok 4.3, grok-4.3-latest y grok-latest, además de reasoning effort none, low, medium y high. La guía de retirada del 15 de mayo también dirigía varios modelos antiguos de Grok 4, Grok 3, reasoning, non-reasoning y coding hacia Grok 4.3. Por eso, para la mayoría de text API nuevos o migrados, Grok 4.3 es el primer test limpio.

Grok 4.20 sigue siendo real, pero no como sucesor universal. La página de Grok 4.20 reasoning de xAI describe 2M context window y reasoning capability; Vercel, Oracle y otros providers también muestran variantes reasoning, non-reasoning y multi-agent. Esa evidencia sirve para rutas concretas. No convierte cada etiqueta 4.20 en una mejor opción para cualquier text API.
Cuándo Grok 4.3 debe ser el default
Usa Grok 4.3 primero cuando el trabajo es una integración de texto normal: soporte, extracción, clasificación, resumen, RAG, escritura asistida, automatización de workflows o migración desde IDs antiguos. La ventaja no es marketing. Un modelo first-party actual con aliases documentados, control de reasoning y guía de migración reduce variables frente a un alias beta o una ruta provider.
El test útil es pequeño. Elige Grok 4.3 o grok-4.3-latest, define reasoning effort, ejecuta el mismo prompt set y registra latency, accepted answer rate, token usage, refusal behavior, error handling y rollback path. Si el workload no necesita contexto extremo, multi-agent, media generation ni realtime audio, este test resuelve la decisión antes que una comparación de todos los nombres visibles.
Un workload non-reasoning tampoco exige otra familia por defecto. La migration guidance de xAI empuja varios casos non-reasoning hacia Grok 4.3 con reasoning effort desactivado. Para clasificación, formato, respuesta corta o extracción predecible, prueba Grok 4.3 con reasoning off. Solo evalúa una rama 4.20 non-reasoning cuando el despliegue ya pertenece a un provider y ese provider documenta la ruta.
Mantén los números cerca del dueño. El 8 de mayo de 2026, la página de Grok 4.3 mostraba 1M context window y precios por tokens. Esos datos sirven para presupuesto, no para promesas permanentes. Antes de producción, vuelve a abrir model page, Console, account limits y status porque geografía, cuenta, límites y disponibilidad pueden variar.
Dónde Grok 4.20 sigue entrando
Mantén Grok 4.20 cuando el caso necesita la rama reasoning, un experimento con 2M context, una ruta provider, una beta surface validada o multi-agent. La pregunta correcta no es si 4.20 suena más nuevo. La pregunta es si el contrato 4.20 posee ese trabajo concreto.
La rama reasoning encaja con lógica compleja, análisis largo, investigación y code reasoning. La documentación de Oracle OCI, por ejemplo, separa modelos Grok 4.20 reasoning y non-reasoning, y asocia reasoning con análisis complejo. Esa señal ayuda a usuarios de OCI, pero sigue siendo comportamiento OCI. No prueba disponibilidad, precio o ciclo de vida first-party en cada cuenta xAI.
La rama non-reasoning es más estrecha. Vercel AI Gateway describe Grok 4.20 Non-Reasoning como ruta beta para speed/direct answers, con un model string propio del provider. Para una app que ya usa Vercel AI SDK puede ser la ruta correcta. Para una integración xAI directa no invalida la primera prueba con Grok 4.3 y reasoning desactivado.
| Necesidad | Primer test más seguro | Sube de ruta si |
|---|---|---|
| text API first-party actual | Grok 4.3 | Grok 4.3 falla acceptance tests |
| respuesta directa y baja latencia | Grok 4.3 con reasoning off | el provider ya posee deployment y documenta non-reasoning 4.20 |
| análisis con 2M context | Grok 4.20 reasoning route | el contexto extra se usa y recall se mide |
| deployment por gateway | model ID del provider | precio, límites, data policy y región son aceptables |
Todo debe medirse. 2M context no garantiza recall perfecto. Non-reasoning no garantiza el output aceptado más barato. Un alias beta no garantiza default de largo plazo. Compara el mismo workload por calidad, latencia, coste y fallback.
Multi-agent es una decisión de workload
Grok 4.20 multi-agent es la rama más fácil de sobreusar. La documentación de xAI la marca como beta, coordina varios agentes, soporta built-in tools, devuelve por defecto la salida del leader y puede usar configuraciones de 4 o 16 agentes. Es potente para research, coding, información amplia y reasoning con herramientas. No es el primer camino para chat rutinario, extracción simple o respuestas breves de soporte.

La prueba real es el total failure cost. Los docs de xAI indican que se facturan tokens del leader, sub-agents y llamadas server-side tools. La pregunta no es si más agentes parecen más fuertes. La pregunta es si reducen investigación perdida, revisión humana o rework más de lo que aumentan usage.
| Condición | Por qué importa |
|---|---|
| La tarea tiene subproblemas paralelos | Los agentes tienen trabajo independiente |
| Tools o live research cambian la respuesta | Si no, un solo modelo es más simple |
| El output tendrá review o acceptance | Más generación exige más validación |
| El budget absorbe leader, sub-agents y tools | El coste ya no equivale a una completion normal |
Multi-agent también cambia la forma de API. Pertenece a la ruta Responses API y no necesariamente a cada wrapper de chat completions. SDK, provider, observability, retry, billing attribution y response parsing deben comprobarse antes de tratarlo como un simple model string.
Imagine y Voice son rutas separadas
Grok Imagine no es el modo imagen de Grok 4.3. Es una ruta de image/video generation con model IDs, endpoints, assets temporales, quality choices, duration, resolution y pricing propios. Los docs de xAI revisados el 8 de mayo de 2026 describían grok-imagine-image y grok-imagine-video, y señalaban que grok-imagine-image-pro estaba programado para deprecation el 15 de mayo de 2026, recomendando la ruta quality para nuevos requests de imagen. Úsalo como señal de migración con fecha, no como copy permanente.

Video vive en la familia Imagine pero tiene otra implementación: async generation, polling, temporary video URLs, duration y resolution. Si el requisito es crear media, la decisión ya no es Grok 4.3 contra Grok 4.20. La decisión es image endpoint, video endpoint, calidad, duración, retención de assets, policy boundary y coste.
Grok Voice es otro contrato. Voice overview cubre Voice Agent API, Text to Speech, Speech to Text y Custom Voices; realtime voice usa una ruta propia con latency y pricing distintos. Si el producto necesita spoken agent, live voice interaction, transcription, TTS o custom voice, la arquitectura es audio, no ranking de modelos de texto.
Mantén separados los problemas consumer. Spicy Mode, NSFW image policy, alternativas gratuitas y heavy usage banners pertenecen a otros flujos. Aquí la decisión es developer API routing: texto, multi-agent, media, audio o provider.
Provider ayuda, pero no posee la verdad first-party
Vercel, Oracle, OpenRouter y gateways parecidos pueden ser la forma práctica de usar Grok dentro de un stack existente. Sus páginas prueban aliases, precios, SDK path, límites, región y billing behavior para ese provider. No prueban automáticamente disponibilidad first-party de xAI, precio permanente, paridad de features o account access.
| Lo que provider evidence prueba | Lo que no prueba |
|---|---|
| El provider expone un modelo o alias | xAI Console da el mismo acceso a todas las cuentas |
| Precio, gateway ID, SDK y límites del provider | Precio, lifecycle o context first-party de xAI |
| Observability, retry y billing behavior del provider | Igualdad con otros providers o xAI API |
| Test rápido dentro del stack elegido | Que un beta label sea default seguro a largo plazo |
Oracle puede documentar reasoning/non-reasoning dentro de OCI y multi-agent como API-only. Vercel puede documentar model strings de AI Gateway. Ambos son hechos útiles para su ruta. El error es copiar esos nombres o precios como si pertenecieran a xAI first-party sin verificación.
La checklist de producción es owner, model ID, endpoint, price, rate limits, data policy, region, lifecycle note, status, account access y fallback. Si una respuesta viene de un provider, conserva el nombre del provider junto a la afirmación.
Checklist antes de cambiar una integración Grok
Antes de tocar config, escribe una decisión de ruta. Evita que Grok 4.3, Grok 4.20, Imagine, Voice y provider labels se conviertan en un único interruptor.
| Check | Pass condition |
|---|---|
| Workload owner | texto, multi-agent, image/video, voice o provider está explícito |
| Model o endpoint | se usa Grok 4.3, variante 4.20 documentada, Imagine, Voice o alias provider intencional |
| Riesgo de retirement/deprecation | old Grok IDs e Imagine changes se revisan en docs actuales |
| Reasoning setting | direct tasks tienen setting explícito o ruta documentada |
| Cost surface | tokens, sub-agents, tools, images, video, voice y provider billing están separados |
| Availability proof | xAI docs, Console, status o provider docs sostienen cada claim |
| Rollback | previous model, acceptance set y rollback step están escritos |
Status page solo sirve como señal de salud con timestamp. Un componente API en verde no garantiza acceso para tu cuenta. Un listing de provider no garantiza status first-party. Si el problema parece high-demand banner, account issue o platform incident, guarda timestamp, request ID y ruta activa antes de cambiar model name.
Preguntas frecuentes
¿Grok 4.3 es más nuevo que Grok 4.20?
Para la mayoría de text API first-party actuales, Grok 4.3 es la ruta que xAI muestra en model page y migration docs. Grok 4.20 sigue apareciendo para reasoning, non-reasoning, 2M context, provider y multi-agent. La respuesta es por ruta, no por ranking numérico.
¿Grok 4.3 reemplaza a Grok 4.20?
Reemplaza varias rutas de texto antiguas para muchos trabajos de migración, pero no borra cada rama 4.20. Conserva 4.20 cuando el workload necesita reasoning, non-reasoning, 2M-context, provider o multi-agent documentado.
¿Qué modelo usar primero en una nueva app Grok API?
Empieza con Grok 4.3, fija reasoning effort y ejecuta acceptance tests. Las excepciones son multi-agent research, image/video generation, realtime voice o deployment que ya pertenece a un provider.
¿Cuándo vale la pena Grok 4.20 multi-agent?
Cuando hay subproblemas paralelos, tools cambian la respuesta, el output tendrá review y el budget cubre leader, sub-agents y tool usage. No es la primera ruta para chat rutinario o extracción simple.
¿Grok Imagine forma parte de Grok 4.3?
No. Grok Imagine es una ruta image/video con model IDs, endpoint behavior, asset lifecycle, quality, duration, resolution y pricing propios.
¿Grok Voice es un modelo de texto?
No. Grok Voice es una familia audio para realtime voice agents, TTS, STT y custom voices. Se elige por requisitos de audio.
¿Puedo confiar en nombres de Vercel, Oracle u OpenRouter?
Sí para la ruta que ese provider posee. Una página provider prueba alias, precio, SDK path o availability del provider; no prueba paridad first-party de xAI.
¿Qué revisar antes de producción?
Revisa xAI model docs, Console access, migration notes, Imagine y Voice docs, provider model pages, precios actuales, rate limits, status y account-specific availability. Cada hecho volátil debe ir unido a owner y fecha.



