Grok 4.3 vs Grok 4.20: qué modelo xAI, Imagine o Voice conviene usar

Para elegir Grok en una integración real, no empieces por el número de versión. Empieza por la ruta que posee el trabajo. Para text API normal, migración desde modelos antiguos, extracción, resumen, RAG, clasificación y automatización, prueba primero Grok 4.3. Lleva Grok 4.20 a la mesa solo cuando el caso necesita reasoning, non-reasoning, contexto de 2M, una ruta provider ya elegida o multi-agent. Grok Imagine y Grok Voice son familias separadas de imagen/video y audio, no modos superiores de un mismo modelo de texto.

Ruta	Úsala cuando	Verifica	Caveat
Grok 4.3	Nueva app de text API o migración de modelos antiguos	página de modelos de xAI, aliases, reasoning effort, contexto, precio	precio, contexto y disponibilidad deben revisarse con fecha
Grok 4.20 reasoning / non-reasoning	necesitas razonamiento profundo, respuesta directa, 2M context o provider route	model IDs de xAI o provider y modos soportados	no todo label 4.20 reemplaza a 4.3
Grok 4.20 multi-agent	hay investigación paralela, herramientas, coding o decisiones complejas	Responses API, número de agentes, tools, billing	leader, sub-agents y tools cambian el coste
Grok Imagine	necesitas generar imagen o video	image/video models, endpoint, quality, duration, resolution	es media route, no text-model mode
Grok Voice	necesitas realtime voice, TTS, STT o custom voices	Voice Agent API, realtime, TTS, STT docs	audio tiene endpoint, latencia y precio propios
Provider route	ya despliegas con Vercel, Oracle, OpenRouter u otro gateway	model name, región, límites, precio, lifecycle del provider	el provider prueba su contrato, no disponibilidad universal de xAI

La regla de parada es concreta: no cambies production a multi-agent ni a un alias de provider hasta conocer owner, endpoint family, cost surface, lifecycle, availability y rollback. Si el producto necesita imagen o video, verifica Imagine. Si necesita audio, verifica Voice. Si el trabajo es texto, vuelve a Grok 4.3 y a las ramas 4.20 que el caso justifique.

Primero la ruta, luego el nombre

Los nombres de Grok mezclan contratos diferentes: modelos first-party de texto de xAI, variantes especializadas de Grok 4.20, multi-agent orchestration, generación de imagen/video, realtime voice/audio y modelos empaquetados por providers. Mirarlos como una sola escalera de versiones provoca malas decisiones: el número mayor o el nombre más llamativo parece ganar aunque no sea el dueño del workload. En una integración API importa saber qué ruta posee el trabajo, qué model ID o endpoint exige y quién responde por disponibilidad y precio.

A 8 de mayo de 2026, la página de Grok 4.3 en la documentación de xAI listaba Grok 4.3, grok-4.3-latest y grok-latest, además de reasoning effort none, low, medium y high. La guía de retirada del 15 de mayo también dirigía varios modelos antiguos de Grok 4, Grok 3, reasoning, non-reasoning y coding hacia Grok 4.3. Por eso, para la mayoría de text API nuevos o migrados, Grok 4.3 es el primer test limpio.

Mapa de model ID y migración para Grok 4.3, Grok 4.20, Imagine y Voice

Grok 4.20 sigue siendo real, pero no como sucesor universal. La página de Grok 4.20 reasoning de xAI describe 2M context window y reasoning capability; Vercel, Oracle y otros providers también muestran variantes reasoning, non-reasoning y multi-agent. Esa evidencia sirve para rutas concretas. No convierte cada etiqueta 4.20 en una mejor opción para cualquier text API.

Cuándo Grok 4.3 debe ser el default

Usa Grok 4.3 primero cuando el trabajo es una integración de texto normal: soporte, extracción, clasificación, resumen, RAG, escritura asistida, automatización de workflows o migración desde IDs antiguos. La ventaja no es marketing. Un modelo first-party actual con aliases documentados, control de reasoning y guía de migración reduce variables frente a un alias beta o una ruta provider.

El test útil es pequeño. Elige Grok 4.3 o grok-4.3-latest, define reasoning effort, ejecuta el mismo prompt set y registra latency, accepted answer rate, token usage, refusal behavior, error handling y rollback path. Si el workload no necesita contexto extremo, multi-agent, media generation ni realtime audio, este test resuelve la decisión antes que una comparación de todos los nombres visibles.

Un workload non-reasoning tampoco exige otra familia por defecto. La migration guidance de xAI empuja varios casos non-reasoning hacia Grok 4.3 con reasoning effort desactivado. Para clasificación, formato, respuesta corta o extracción predecible, prueba Grok 4.3 con reasoning off. Solo evalúa una rama 4.20 non-reasoning cuando el despliegue ya pertenece a un provider y ese provider documenta la ruta.

Mantén los números cerca del dueño. El 8 de mayo de 2026, la página de Grok 4.3 mostraba 1M context window y precios por tokens. Esos datos sirven para presupuesto, no para promesas permanentes. Antes de producción, vuelve a abrir model page, Console, account limits y status porque geografía, cuenta, límites y disponibilidad pueden variar.

Dónde Grok 4.20 sigue entrando

Mantén Grok 4.20 cuando el caso necesita la rama reasoning, un experimento con 2M context, una ruta provider, una beta surface validada o multi-agent. La pregunta correcta no es si 4.20 suena más nuevo. La pregunta es si el contrato 4.20 posee ese trabajo concreto.

La rama reasoning encaja con lógica compleja, análisis largo, investigación y code reasoning. La documentación de Oracle OCI, por ejemplo, separa modelos Grok 4.20 reasoning y non-reasoning, y asocia reasoning con análisis complejo. Esa señal ayuda a usuarios de OCI, pero sigue siendo comportamiento OCI. No prueba disponibilidad, precio o ciclo de vida first-party en cada cuenta xAI.

La rama non-reasoning es más estrecha. Vercel AI Gateway describe Grok 4.20 Non-Reasoning como ruta beta para speed/direct answers, con un model string propio del provider. Para una app que ya usa Vercel AI SDK puede ser la ruta correcta. Para una integración xAI directa no invalida la primera prueba con Grok 4.3 y reasoning desactivado.

Necesidad	Primer test más seguro	Sube de ruta si
text API first-party actual	Grok 4.3	Grok 4.3 falla acceptance tests
respuesta directa y baja latencia	Grok 4.3 con reasoning off	el provider ya posee deployment y documenta non-reasoning 4.20
análisis con 2M context	Grok 4.20 reasoning route	el contexto extra se usa y recall se mide
deployment por gateway	model ID del provider	precio, límites, data policy y región son aceptables

Todo debe medirse. 2M context no garantiza recall perfecto. Non-reasoning no garantiza el output aceptado más barato. Un alias beta no garantiza default de largo plazo. Compara el mismo workload por calidad, latencia, coste y fallback.

Multi-agent es una decisión de workload

Grok 4.20 multi-agent es la rama más fácil de sobreusar. La documentación de xAI la marca como beta, coordina varios agentes, soporta built-in tools, devuelve por defecto la salida del leader y puede usar configuraciones de 4 o 16 agentes. Es potente para research, coding, información amplia y reasoning con herramientas. No es el primer camino para chat rutinario, extracción simple o respuestas breves de soporte.

Tablero de decisión entre reasoning, non-reasoning y multi-agent con caveat de coste

La prueba real es el total failure cost. Los docs de xAI indican que se facturan tokens del leader, sub-agents y llamadas server-side tools. La pregunta no es si más agentes parecen más fuertes. La pregunta es si reducen investigación perdida, revisión humana o rework más de lo que aumentan usage.

Condición	Por qué importa
La tarea tiene subproblemas paralelos	Los agentes tienen trabajo independiente
Tools o live research cambian la respuesta	Si no, un solo modelo es más simple
El output tendrá review o acceptance	Más generación exige más validación
El budget absorbe leader, sub-agents y tools	El coste ya no equivale a una completion normal

Multi-agent también cambia la forma de API. Pertenece a la ruta Responses API y no necesariamente a cada wrapper de chat completions. SDK, provider, observability, retry, billing attribution y response parsing deben comprobarse antes de tratarlo como un simple model string.

Imagine y Voice son rutas separadas

Grok Imagine no es el modo imagen de Grok 4.3. Es una ruta de image/video generation con model IDs, endpoints, assets temporales, quality choices, duration, resolution y pricing propios. Los docs de xAI revisados el 8 de mayo de 2026 describían grok-imagine-image y grok-imagine-video, y señalaban que grok-imagine-image-pro estaba programado para deprecation el 15 de mayo de 2026, recomendando la ruta quality para nuevos requests de imagen. Úsalo como señal de migración con fecha, no como copy permanente.

Separación entre Grok Imagine y Grok Voice como rutas media y audio

Video vive en la familia Imagine pero tiene otra implementación: async generation, polling, temporary video URLs, duration y resolution. Si el requisito es crear media, la decisión ya no es Grok 4.3 contra Grok 4.20. La decisión es image endpoint, video endpoint, calidad, duración, retención de assets, policy boundary y coste.

Grok Voice es otro contrato. Voice overview cubre Voice Agent API, Text to Speech, Speech to Text y Custom Voices; realtime voice usa una ruta propia con latency y pricing distintos. Si el producto necesita spoken agent, live voice interaction, transcription, TTS o custom voice, la arquitectura es audio, no ranking de modelos de texto.

Mantén separados los problemas consumer. Spicy Mode, NSFW image policy, alternativas gratuitas y heavy usage banners pertenecen a otros flujos. Aquí la decisión es developer API routing: texto, multi-agent, media, audio o provider.

Provider ayuda, pero no posee la verdad first-party

Vercel, Oracle, OpenRouter y gateways parecidos pueden ser la forma práctica de usar Grok dentro de un stack existente. Sus páginas prueban aliases, precios, SDK path, límites, región y billing behavior para ese provider. No prueban automáticamente disponibilidad first-party de xAI, precio permanente, paridad de features o account access.

Lo que provider evidence prueba	Lo que no prueba
El provider expone un modelo o alias	xAI Console da el mismo acceso a todas las cuentas
Precio, gateway ID, SDK y límites del provider	Precio, lifecycle o context first-party de xAI
Observability, retry y billing behavior del provider	Igualdad con otros providers o xAI API
Test rápido dentro del stack elegido	Que un beta label sea default seguro a largo plazo

Oracle puede documentar reasoning/non-reasoning dentro de OCI y multi-agent como API-only. Vercel puede documentar model strings de AI Gateway. Ambos son hechos útiles para su ruta. El error es copiar esos nombres o precios como si pertenecieran a xAI first-party sin verificación.

La checklist de producción es owner, model ID, endpoint, price, rate limits, data policy, region, lifecycle note, status, account access y fallback. Si una respuesta viene de un provider, conserva el nombre del provider junto a la afirmación.

Checklist antes de cambiar una integración Grok

Antes de tocar config, escribe una decisión de ruta. Evita que Grok 4.3, Grok 4.20, Imagine, Voice y provider labels se conviertan en un único interruptor.

Check	Pass condition
Workload owner	texto, multi-agent, image/video, voice o provider está explícito
Model o endpoint	se usa Grok 4.3, variante 4.20 documentada, Imagine, Voice o alias provider intencional
Riesgo de retirement/deprecation	old Grok IDs e Imagine changes se revisan en docs actuales
Reasoning setting	direct tasks tienen setting explícito o ruta documentada
Cost surface	tokens, sub-agents, tools, images, video, voice y provider billing están separados
Availability proof	xAI docs, Console, status o provider docs sostienen cada claim
Rollback	previous model, acceptance set y rollback step están escritos

Status page solo sirve como señal de salud con timestamp. Un componente API en verde no garantiza acceso para tu cuenta. Un listing de provider no garantiza status first-party. Si el problema parece high-demand banner, account issue o platform incident, guarda timestamp, request ID y ruta activa antes de cambiar model name.

Preguntas frecuentes

¿Grok 4.3 es más nuevo que Grok 4.20?

Para la mayoría de text API first-party actuales, Grok 4.3 es la ruta que xAI muestra en model page y migration docs. Grok 4.20 sigue apareciendo para reasoning, non-reasoning, 2M context, provider y multi-agent. La respuesta es por ruta, no por ranking numérico.

¿Grok 4.3 reemplaza a Grok 4.20?

Reemplaza varias rutas de texto antiguas para muchos trabajos de migración, pero no borra cada rama 4.20. Conserva 4.20 cuando el workload necesita reasoning, non-reasoning, 2M-context, provider o multi-agent documentado.

¿Qué modelo usar primero en una nueva app Grok API?

Empieza con Grok 4.3, fija reasoning effort y ejecuta acceptance tests. Las excepciones son multi-agent research, image/video generation, realtime voice o deployment que ya pertenece a un provider.

¿Cuándo vale la pena Grok 4.20 multi-agent?

Cuando hay subproblemas paralelos, tools cambian la respuesta, el output tendrá review y el budget cubre leader, sub-agents y tool usage. No es la primera ruta para chat rutinario o extracción simple.

¿Grok Imagine forma parte de Grok 4.3?

No. Grok Imagine es una ruta image/video con model IDs, endpoint behavior, asset lifecycle, quality, duration, resolution y pricing propios.

¿Grok Voice es un modelo de texto?

No. Grok Voice es una familia audio para realtime voice agents, TTS, STT y custom voices. Se elige por requisitos de audio.

¿Puedo confiar en nombres de Vercel, Oracle u OpenRouter?

Sí para la ruta que ese provider posee. Una página provider prueba alias, precio, SDK path o availability del provider; no prueba paridad first-party de xAI.

¿Qué revisar antes de producción?

Revisa xAI model docs, Console access, migration notes, Imagine y Voice docs, provider model pages, precios actuales, rate limits, status y account-specific availability. Cada hecho volátil debe ir unido a owner y fecha.