OpenAI Models10 min

Mapa de modelos de OpenAI: GPT-5.5, GPT Image 2, Codex, Realtime, Audio y Sora 2

Separa GPT-5.5 Instant, GPT-5.5 Pro, GPT Image 2, GPT-5.3-Codex, gpt-realtime-1.5, gpt-audio-1.5 y Sora 2 por ChatGPT, API, Codex, imagen, voz en tiempo real, audio y video.

YingTu AI Team
YingTu AI Team
YingTu Editorial
8 may 2026
10 min
Mapa de modelos de OpenAI: GPT-5.5, GPT Image 2, Codex, Realtime, Audio y Sora 2
yingtu.ai

Contenido

No se detectaron encabezados

Mapa de modelos de OpenAI: GPT-5.5, GPT Image 2, Codex, Realtime, Audio y Sora 2

Al 8 de mayo de 2026, GPT-5.5 Pro, GPT-5.5 Instant, GPT Image 2, GPT-5.3-Codex, gpt-realtime-1.5, gpt-audio-1.5, Sora 2 y Sora 2 Pro no forman un único menú de modelos. Son nombres que aparecen en superficies distintas de OpenAI: ChatGPT, API, Codex, imágenes, voz en tiempo real, audio request/response y Sora video.

La forma segura de elegir es empezar por la tarea, pasar por la superficie correcta y solo después copiar el nombre público. GPT-5.5 Instant pertenece al lado visible de ChatGPT. gpt-5.5 y gpt-5.5-pro pertenecen a la API de razonamiento. GPT Image 2 apunta a gpt-image-2. Codex tiene su propia ruta de modelos. Realtime y Audio resuelven problemas de audio diferentes. Sora exige mirar la app y la ruta legacy de Videos API por separado.

TareaPrimera rutaNombre o IDCautela
Usar ChatGPTChatGPTGPT-5.5 InstantNo pegar la etiqueta como si fuera ID universal de API
Razonamiento backendOpenAI APIgpt-5.5 / gpt-5.5-proPro puede cambiar latencia, coste y manejo de trabajos largos
Generar o editar imágenesImages APIgpt-image-2Precio y límites deben revisarse en páginas específicas
Trabajo de códigoCodexgpt-5.3-codex o GPT-5.5 expuesto por CodexEl selector de Codex y la autenticación importan
Voz interactivaRealtime APIgpt-realtime-1.5Una sesión realtime no es un job de audio REST
Audio request/responseChat Completions audiogpt-audio-1.5Mejor punto de partida para tareas de audio por solicitud
Video con SoraSora app o legacy Videos APIsora-2 / sora-2-proRevisar legacy status y apagado de Videos API el 2026-09-24

Los datos cambiantes no deben quedar congelados aquí. Precio exacto, límite gratuito, región, cuenta, routing de proveedores, garantía de velocidad, reembolso, fallos de cobro o disponibilidad de Sora API se comprueban el mismo día en la fuente responsable.

GPT-5.5: Instant, API y Pro no son el mismo identificador

El error más común es leer GPT-5.5 Instant como si fuera el nombre que se pone directamente en el parámetro model. En ChatGPT, Instant es una etiqueta visible de producto y una experiencia predeterminada. Sirve para entender qué ruta usa la aplicación, no para inventar un ID público de API.

Para código, manda la documentación de la API. gpt-5.5 y gpt-5.5-pro son nombres públicos para razonamiento en la API; la ruta relacionada con Instant puede aparecer como chat-latest u otra forma documentada para el endpoint actual. Los nombres están relacionados, pero no responden a la misma pregunta.

GPT-5.5 Pro tampoco significa “usar siempre el más caro”. Tiene sentido para razonamiento difícil, análisis largo, planificación agentic y respuestas de alto valor. Antes de convertirlo en default, conviene medir latencia, coste, timeout, modo background, logging y fallback.

La depuración también cambia. Si el modo no aparece en ChatGPT, se revisa cuenta, plan, rollout y selector. Si una llamada API falla, se revisa endpoint, organización, billing, model ID, request body y acceso actual. Mezclar los nombres retrasa la solución.

Ruta de superficie: elegir la capa antes del modelo

La lista de nombres se vuelve útil cuando separas las superficies. ChatGPT es experiencia de aplicación. OpenAI API es integración backend. Codex es flujo de trabajo de código. Images API es generación o edición visual. Realtime es sesión de voz con baja latencia. Audio 1.5 es trabajo de audio por solicitud. Sora combina producto de video y una ruta API que debe revisarse por su estado legacy.

Diagrama de rutas OpenAI por tarea, superficie y nombre del modelo

La ruta equivocada crea diagnósticos falsos. Un display name de ChatGPT en la API parece un problema de modelo, pero en realidad es un nombre equivocado. Un modelo de imagen evaluado como si fuera modelo de texto lleva a una comparación sin sentido. Acceso a la app de Sora no prueba que un backend pueda usar una ruta estable.

En una revisión de producto, la pregunta inicial debería ser: ¿el usuario conversa, el servidor razona, el agente modifica código, el sistema crea imágenes, la experiencia requiere voz en vivo, el backend procesa audio o el creador produce video? Esa pregunta reduce la lista mejor que cualquier ranking genérico.

IDs públicos: qué nombre es seguro para el código

La implementación debe usar IDs públicos de la superficie correcta. Una etiqueta de producto puede orientar a un humano; un ID público es lo que soporta una llamada. Por eso conviene revisar el modelo dentro del endpoint real antes de cambiar un servicio.

Tabla de IDs públicos para GPT-5.5 GPT Image 2 Codex Realtime Audio y Sora

NombreLectura segura para desarrolloNo asumir
GPT-5.5 InstantEtiqueta de ChatGPT; la API sigue chat-latest o los docs actualesque Instant sea ID universal de API
GPT-5.5 Progpt-5.5-pro como modelo API; ChatGPT Pro sigue siendo una superficie de appmisma latencia que estándar
GPT Image 2gpt-image-2 para generación/edición de imágenesque una tabla de razonamiento responda límites de imagen
GPT-5.3-CodexRuta de código orientada a Codexque todos los clientes Codex muestren lo mismo
Realtime 1.5gpt-realtime-1.5 para sesiones en vivoque sea igual que audio por solicitud
Audio 1.5gpt-audio-1.5 para trabajos de audioque sustituya Realtime
Sora 2 / Prosora-2 / sora-2-pro con cautela legacyque la app pruebe backend estable

Esta tabla no es un ranking de calidad. Es una tabla de seguridad de copia. Evita poner una etiqueta de ChatGPT en código, elegir una ruta de imagen para una tarea de texto o iniciar un backend de Sora sin revisar el estado de Videos API.

Codex: la ruta de código se decide dentro de Codex

Codex no es una copia plana del catálogo de modelos de API. El selector de Codex, el inicio de sesión con ChatGPT, una clave API, la CLI local, el IDE y las tareas en la nube pueden exponer modelos y límites diferentes. Que un modelo exista en la API no resuelve automáticamente el flujo de código.

Si Codex expone GPT-5.5, puede ser la primera opción para tareas difíciles de repositorio. gpt-5.3-codex sigue importando cuando el trabajo se beneficia de un modelo afinado para código o cuando la ruta actual lo recomienda. La comparación real se mide en parches, alcance mínimo, lectura de tests y reparación de errores.

Las pruebas deben parecerse al trabajo. Un bug pequeño, una refactorización con límites, un test que falla, una integración API y un review de código dicen más que una pregunta general. Un buen modelo de Codex no solo escribe; cambia los archivos correctos y deja evidencia revisable.

GPT Image 2: nombre de producto, ID y flujo son cosas distintas

GPT Image 2 tiene un ID claro para desarrollo: gpt-image-2. Aun así, generación de imágenes, edición, consistencia entre varias imágenes y flujos que combinan texto con imagen no son idénticos. La forma del request, el manejo de archivos, el formato de salida, el coste y la recuperación de errores cambian.

Las afirmaciones de precio, gratis, límite, 4K, proveedor más barato, sin límites o fallo sin cobro son volátiles. Un mapa general puede decir que el trabajo de imagen empieza por gpt-image-2; las condiciones comerciales se revisan en una pieza específica y con fuentes actuales.

Los proveedores pueden ayudar a descubrir rutas de acceso, pero no sustituyen a la fuente responsable del estado oficial. Para producción, separa identidad del modelo, comportamiento de la API, términos del proveedor, datos, reintentos y facturación.

Realtime 1.5 y Audio 1.5: una sesión de voz no es un job de audio

gpt-realtime-1.5 sirve para experiencias de baja latencia: voz en vivo, interrupciones, streaming, sesión y estado conversacional. Si el producto debe reaccionar mientras el usuario habla, esta es la ruta que se inspecciona primero.

gpt-audio-1.5 encaja mejor con audio dentro de Chat Completions: entender un audio, generar una respuesta hablada o integrar un paso de audio en un backend por solicitud. No necesita la misma arquitectura de sesión que Realtime.

Al migrar código antiguo, revisa deprecations. Los nombres preview, formatos de audio y endpoints pueden quedarse atrás. La decisión correcta depende de la interfaz que espera el usuario, no solo de que ambas rutas mencionen audio.

Sora 2 y Sora 2 Pro: aplicación por un lado, riesgo API por otro

Sora es el caso donde más daño hace mezclar app y backend. La app o la web de Sora habla de creación de video para usuarios. Los modelos sora-2 y sora-2-pro en páginas API deben leerse junto con la etiqueta legacy y la fecha de apagado de Videos API: 2026-09-24.

Límite de Sora 2 entre aplicación y legacy Videos API con fecha de apagado

Eso no significa que Sora nunca haya tenido API, ni que acceder a la app pruebe una ruta estable para nuevos productos. Creación manual, demos internas, automatización de video y backend de largo plazo son decisiones distintas.

Antes de construir sobre Sora por API, confirma ruta soportada, estado de legacy API, migración, región, cuenta, cuota, coste, derechos de salida y plan de fallback. Si la ruta actual no se puede nombrar con claridad, la decisión prudente es pausar la integración.

Qué modelo de OpenAI elegir primero

Empieza por el trabajo. Para chat backend o agentes, prueba gpt-5.5 y sube a gpt-5.5-pro cuando la tarea lo justifique. Para uso de ChatGPT, mira Instant dentro de la app. Para imagen, gpt-image-2. Para código, Codex. Para voz en vivo, Realtime. Para audio por solicitud, Audio 1.5. Para video, Sora app; para backend de video, primero el estado legacy.

TrabajoPrimera rutaMotivo
Uso de ChatGPTGPT-5.5 InstantEs la decisión visible en la app
Razonamiento APIgpt-5.5 / gpt-5.5-proSon nombres públicos para llamadas API
Agente de códigoCodexEl selector y la autenticación importan
Imagengpt-image-2La interfaz de imagen es propia
Voz en vivogpt-realtime-1.5Necesita sesión realtime
Audio por solicitudgpt-audio-1.5Encaja con request/response
Sora videoSora app o revisión legacy APIApp y API no prueban lo mismo

El contrato de producción no es “usar el modelo nuevo”. Es: superficie correcta, endpoint correcto, ID público, acceso de cuenta, estado de deprecación, coste aceptable y una comprobación actual de los hechos que cambian.

Preguntas frecuentes

¿GPT-5.5 Instant es un ID de API?

Trátalo como etiqueta de ChatGPT. Para API usa la ruta documentada, como chat-latest cuando aplique, o modelos públicos como gpt-5.5 y gpt-5.5-pro.

¿Cuándo conviene GPT-5.5 Pro?

Cuando la tarea requiere razonamiento más duro, análisis largo o trabajo agentic de alto valor. No lo conviertas en default sin medir latencia, coste y manejo de trabajos largos.

¿GPT Image 2 es lo mismo que ChatGPT Images 2.0?

No en la misma capa. GPT Image 2 es el nombre de modelo/API, con gpt-image-2 como ID. ChatGPT Images 2.0 es una experiencia de producto.

¿Por qué Codex se revisa aparte?

Porque Codex puede depender de selector, login, clave API, CLI, IDE o cloud task. La visibilidad en la API no cierra toda la decisión de código.

¿Uso gpt-realtime-1.5 o gpt-audio-1.5?

Usa Realtime para voz viva con streaming e interrupciones. Usa Audio 1.5 para trabajos de audio por solicitud.

¿Sora 2 es seguro para un producto API?

Solo después de revisar el estado actual y la ruta soportada. Acceso a la app y páginas API legacy no prueban una nueva ruta backend estable.

Etiquetas

Compartir este artículo

XTelegram