OpenAI Models12 min

OpenAIモデル早見表:GPT-5.5、GPT Image 2、Codex、Realtime、Audio、Sora 2

GPT-5.5 Instant、GPT-5.5 Pro、GPT Image 2、GPT-5.3-Codex、gpt-realtime-1.5、gpt-audio-1.5、Sora 2を、ChatGPT、API、Codex、画像、音声、動画の入口ごとに整理します。

YingTu AI Team
YingTu AI Team
YingTu Editorial
2026年5月8日
12 min
OpenAIモデル早見表:GPT-5.5、GPT Image 2、Codex、Realtime、Audio、Sora 2
yingtu.ai

目次

見出しがありません

OpenAIモデル早見表:GPT-5.5、GPT Image 2、Codex、Realtime、Audio、Sora 2

2026年5月8日時点で、GPT-5.5 Pro、GPT-5.5 Instant、GPT Image 2、GPT-5.3-Codex、gpt-realtime-1.5、gpt-audio-1.5、Sora 2 / Sora 2 Proは、同じ場所で選ぶ一列のモデル名ではありません。まずChatGPT、OpenAI API、Codex、画像API、Realtime、Audio、Soraのどの入口の話かを分ける必要があります。

短く言えば、ChatGPTの通常利用ならGPT-5.5 Instant、APIで推論させるならgpt-5.5またはgpt-5.5-pro、画像ならgpt-image-2、コード作業ならCodex、低遅延の会話型音声ならgpt-realtime-1.5、通常の音声入出力タスクならgpt-audio-1.5、動画ならSoraアプリとlegacy Videos APIの境界を先に見ます。

やりたいこと最初に見る入口使う名前注意点
ChatGPTの既定体験を使うChatGPTGPT-5.5 InstantAPIにそのまま入れる名前とは限らない
APIで高い推論を使うOpenAI APIgpt-5.5 / gpt-5.5-proProは遅延や処理方式も確認する
画像生成や編集を行うImages APIgpt-image-2価格や上限は別途最新確認が必要
コード補助やリポジトリ作業を行うCodexgpt-5.3-codex またはCodex上のGPT-5.5Codexの入口や認証方式で変わる
リアルタイム音声を作るRealtime APIgpt-realtime-1.5通常の音声ジョブとは別の設計
音声を入力または出力する処理を作るChat Completions audiogpt-audio-1.5リクエスト/レスポンス型の音声に向く
Sora動画を扱うSoraアプリまたはlegacy Videos APIsora-2 / sora-2-pro2026-09-24のVideos API停止予定を確認する

この整理で大事なのは、モデル名の新しさよりも入口の正しさです。料金、無料枠、地域、アカウント権限、provider経由の可用性、返金、速度保証、停止予定は変わりやすいため、公開前や実装前にその日の公式情報で再確認します。

GPT-5.5:Instant、API、Proを同じ名前として扱わない

GPT-5.5で最初に分けるべきなのは、ChatGPT上の表示名とAPIで使う公開名です。GPT-5.5 Instantは、ChatGPTの既定体験として理解するのが安全です。ユーザーがアプリで見る名前であり、開発者がコードのmodel欄へそのまま入れる公開IDとは限りません。

API実装では、OpenAIのモデルページや該当endpointの説明に出ている名前を使います。gpt-5.5gpt-5.5-proはAPIで扱う推論モデル名として確認し、Instantに関するAPI経路はchat-latestなど現在の文書に従います。内部名や表示名を推測で組み立てると、エラーの原因がモデルではなく名前の取り違えになります。

GPT-5.5 Proは、複雑な推論、長い分析、agent的な作業、高価値な判断に向きます。ただし、標準のGPT-5.5と同じ待ち時間や運用コストで使えるとは考えない方がよいです。長い処理、バックグラウンド実行、再試行、ログ、予算上限まで含めて設計します。

障害調査の入口も違います。ChatGPTで見えないなら、アカウント、プラン、ロールアウト、モデルピッカーを確認します。APIで失敗するなら、model ID、endpoint、組織権限、billing、request body、現在の可用性を確認します。名前が似ていても、最初に開く場所は別です。

入口の分流:モデル名より先に製品面を選ぶ

OpenAIの名称を使いやすくするには、最初に製品面を分けます。ChatGPTはアプリ体験、OpenAI APIはバックエンド呼び出し、Codexはコード作業、Images APIは画像生成と編集、Realtimeは低遅延音声、Audioはリクエスト/レスポンス型音声、Soraは動画制作とlegacy APIの境界を担当します。

OpenAIの入口をタスク、製品面、モデル名の順で分ける図

間違った入口を選ぶと、正しいモデル名でも実装がずれます。ChatGPTの表示名をAPIに貼る、画像モデルを推論モデルとして比較する、Soraアプリの利用可否をそのままAPI構築可否に読み替える、といったミスはすべて入口の混同から起きます。

プロダクト会議では、まず一文でタスクを書きます。ユーザーに会話させたいのか、サーバーで推論したいのか、リポジトリを直したいのか、画像を作りたいのか、リアルタイム音声を作りたいのか、音声ファイルを処理したいのか、動画を作りたいのか。この一文が決まると、候補のモデル名は自然に絞れます。

開発者向けID:コードに入れる前に公開名を確認する

開発者にとって重要なのは、製品名ではなく、その入口で公開されているmodel IDです。UIで見える名前は説明に役立ちますが、コードではendpointごとの公開名を使います。これを分けないと、レビューで見た人も何を根拠に選んだのか判断できません。

GPT-5.5 GPT Image 2 Codex Realtime Audio Soraの開発者向けID表

名前開発者向けの安全な読み方避けるべき解釈
GPT-5.5 InstantChatGPT側の既定体験。APIはchat-latestや現在のモデル文書を見るInstantをそのまま汎用API IDにする
GPT-5.5 Progpt-5.5-proはAPIモデルとして確認する。ChatGPT Pro表示とは入口が違う標準ルートと同じ遅延で使えると決める
GPT Image 2gpt-image-2として画像生成・編集を確認する推論モデル表で画像の制約を答える
GPT-5.3-CodexCodex向けのコード作業ルートすべてのCodex入口で同じ候補が出ると考える
Realtime 1.5gpt-realtime-1.5として低遅延会話を確認する通常の音声ジョブと同じにする
Audio 1.5gpt-audio-1.5として音声入出力ジョブを確認するRealtimeの代替と決める
Sora 2 / Prosora-2 / sora-2-proとSoraアプリを分けるアプリ利用可否を安定APIの証拠にする

この表は性能ランキングではありません。コピー安全性のための表です。コードに貼る前に、入口、endpoint、model ID、停止予定、アカウント権限を確認するための最低限の整理です。

Codex:コード作業はCodexの入口で判断する

Codexは、OpenAI APIのモデル一覧だけでは判断しきれません。Codex CLI、IDE連携、クラウドタスク、ChatGPTログイン、API key認証では、見えるモデル、使える文脈、失敗時の扱いが変わる可能性があります。APIページで名前が見えることと、Codexの作業ルートで同じように使えることは同じではありません。

Codex上でGPT-5.5が選べる場合、複雑なリポジトリ分析や難しい修正では有力です。一方でgpt-5.3-codexは、コード代理向けの選択肢としてまだ重要です。どちらを使うかは、新しさだけでなく、実際のコード変更、テスト読解、差分の小ささ、不要な変更を避ける力で判断します。

評価タスクもコード用に変えます。小さなバグ修正、制約付きリファクタ、失敗テストの原因調査、API統合、コードレビューを同じリポジトリで試す方が、一般的な質問応答よりも実用性を測れます。

GPT Image 2:製品名、モデルID、ワークフローを分ける

GPT Image 2は、開発者向けにはgpt-image-2として扱うのが基本です。ただし、画像生成、画像編集、複数画像の一貫性、テキスト推論と画像生成を組み合わせるワークフローは同じではありません。モデル名が同じでも、入力、出力、ファイル処理、失敗時の戻し方は変わります。

料金、無料枠、利用上限、4K出力、provider経由の使いやすさ、失敗時の課金は変わりやすい領域です。OpenAIモデル早見表では、画像タスクの入口がgpt-image-2であることまでを示し、細かい価格や上限は個別に最新確認する方が安全です。

ブラウザで試すだけならプロダクト入口でも十分な場合があります。バックエンドで大量生成や編集をするなら、API文書、request形式、ファイル取り扱い、組織権限、ログ、再試行設計を確認します。

Realtime 1.5とAudio 1.5:ライブ音声と音声ジョブを分ける

gpt-realtime-1.5は、低遅延の音声セッション向けです。ユーザーが話し、モデルがすぐ返し、途中で割り込み、ストリームで状態を持つ体験を作るなら、Realtimeから確認します。音声フォーマット、接続、セッション管理、遅延、再接続が設計の中心になります。

gpt-audio-1.5は、Chat Completionsの音声タスクとして考える方が自然です。音声を入力して理解させる、音声出力を返す、バックエンド処理の一段として音声を扱う、といったリクエスト/レスポンス型の用途に向きます。

古いpreview名や以前の音声コードを引き継ぐときは、停止予定ページを確認します。音声系の名称は更新されやすく、endpointやセッション設計も変わりやすいので、モデル名だけで移行可否を判断しない方が安全です。

Sora 2 / Sora 2 Pro:アプリとAPIリスクを分ける

Soraは、アプリ利用とAPI構築を最もはっきり分ける必要があります。SoraアプリやWebで使えることは、動画制作の入口を意味します。一方でsora-2sora-2-proのAPIモデルページを見る場合は、legacy表示とVideos APIの停止予定を同時に確認します。Videos APIのshutdown dateとして2026-09-24が示されている点は、実装判断の前に置くべきです。

Sora 2のアプリ入口とlegacy Videos API停止予定を分ける図

つまり、SoraにAPIがなかったという意味でも、アプリが使えれば新しい安定APIがあるという意味でもありません。消費者向け動画制作、社内デモ、動画生成の自動化、長期API製品は別の判断です。API製品に入れるなら、現在サポートされる構築経路、移行先、アカウント権限、地域、上限、費用、出力権利を確認します。

Soraを扱う計画には、少なくとも二行を用意します。アプリで作る行と、APIで組み込む行です。後者に現在のサポート経路を書けないなら、先に調査と移行計画を置き、実装を急がない方が安全です。

どのOpenAIモデルから始めるべきか

まずタスクを一文にします。チャットやバックエンド推論ならgpt-5.5、重い推論ならgpt-5.5-pro、ChatGPT利用ならInstant、画像ならgpt-image-2、コード作業ならCodex、ライブ音声ならRealtime、音声ジョブならAudio、動画制作ならSoraアプリ、動画APIならlegacy APIの注意から始めます。

タスク最初の入口理由
ChatGPTを使うGPT-5.5 Instantアプリで見える選択だから
APIで推論するgpt-5.5 / gpt-5.5-pro公開IDとendpointが重要だから
コード作業をするCodex入口と認証方式が結果を変えるから
画像を作るgpt-image-2画像モデルのAPI面が別だから
ライブ音声を作るgpt-realtime-1.5低遅延セッションが必要だから
音声処理を行うgpt-audio-1.5リクエスト/レスポンス型に向くから
Sora動画を扱うSoraアプリまたはAPI停止予定確認アプリとAPIの意味が違うから

最後に残る判断は、モデル名ではなく契約です。どの入口で、どの公開IDを、どのendpointで、どの権限と費用と停止予定のもとで使うのか。ここまで書けて初めて、モデル選択は実装可能な判断になります。

よくある質問

GPT-5.5 InstantはAPI IDですか?

ChatGPT側の表示名として扱うのが安全です。APIではchat-latestgpt-5.5gpt-5.5-proなど、現在の文書に出ている公開名を確認します。

GPT-5.5 Proを常に選ぶべきですか?

いいえ。難しい推論や長い作業には向きますが、遅延、費用、バックグラウンド処理を考える必要があります。軽い処理では標準ルートの方が合う場合があります。

GPT Image 2とChatGPT Images 2.0は同じですか?

同じ層ではありません。GPT Image 2はモデル/APIの言い方で、開発者IDはgpt-image-2です。ChatGPT Images 2.0はアプリ側の体験です。

CodexではGPT-5.5とGPT-5.3-Codexのどちらを使いますか?

現在のCodex入口で選べるモデルを確認し、難しい推論ならGPT-5.5、コード代理に特化した作業ならgpt-5.3-codexも候補にします。

gpt-realtime-1.5とgpt-audio-1.5の違いは何ですか?

Realtimeはライブ音声セッション向けです。Audio 1.5はリクエスト/レスポンス型の音声タスク向けです。

Sora 2 APIで新しい製品を作れますか?

現在の停止予定とサポート経路を確認してから判断します。Soraアプリが使えることと、安定した新規API構築経路があることは同じではありません。

タグ

この記事を共有

XTelegram