GPT-5.4がCodexに搭載|ネイティブcomputer-use・100万トークン・miniモデルまで全貌を解説

|Aitly編集部

AIニュース

GPT-5.4がCodexに搭載──ネイティブcomputer-use・100万トークン・miniモデルまで全貌を解説

2026年3月18日 Aitly編集部

この記事のポイント

  • OpenAIがGPT-5.4を3月5日にリリース。推論・コーディング・エージェント型ワークフローを統合した最高性能モデル
  • 汎用モデルとして初めてネイティブcomputer-use機能を搭載。不動産ポータル操作で初回成功率95%を達成
  • 最大105万トークンのコンテキストウィンドウ。GPT-5.2比で虚偽の主張33%減少
  • SWE-Bench Proで57.7%を記録し、GPT-5.3-Codex(56.8%)を上回る
  • 3月17日にGPT-5.4 mini・nanoも公開。miniはGPT-5.4に近い性能を大幅に安い料金で提供

GPT-5.4とは──GPT-5.3-Codexの後継にして最高性能モデル

OpenAIは2026年3月5日、GPT-5.4をChatGPT・Codex・APIの3プラットフォーム同時にリリースした。OpenAI公式ブログによると、GPT-5.4はGPT-5.3-Codexのフロンティアレベルのコーディング能力を継承しつつ、ツール操作・ソフトウェア環境・スプレッドシートやプレゼンテーションなどの業務タスク全般で大幅な改善を実現した「プロフェッショナル向け最高性能モデル」だ。

GPT-5.2と比較して、個別の回答に虚偽の主張が含まれる確率が33%低下し、エラーを含む回答全体の発生率も18%減少した。推論トークンの消費量も大幅に削減されており、OpenAIは「最もトークン効率の高い推論モデル」と位置づけている。レイテンシもGPT-5.3-Codexより低く、コスト面でも実用的な改善が進んだ。

ネイティブcomputer-use──汎用モデル初のPC操作機能

GPT-5.4の最大の特徴は、汎用モデルとして初めてネイティブのcomputer-use(コンピューター操作)機能を搭載した点だ。従来のCUA(Computer Using Agent)モデルとは異なり、GPT-5.4はcomputer-useをモデル自体に組み込んでおり、エージェントがPCを操作して複雑なワークフローをアプリケーション横断で実行できる。

OpenAIの評価によると、約30,000件のHOA(住宅所有者協会)・固定資産税ポータルでの操作テストにおいて、GPT-5.4は初回試行で95%の成功率を達成した。3回以内では100%に到達し、従来のCUAモデル(73〜79%)を大きく上回る。セッション完了速度も約3倍で、トークン消費量は約70%削減された。OSWorld(デスクトップ操作ベンチマーク)では75.0%を記録し、人間のベースライン(72.4%)を超えた初のAIモデルとなった。

100万トークンコンテキストとコーディング性能

GPT-5.4は最大105万トークン(約1Mトークン)のコンテキストウィンドウをサポートする。Codexでは実験的に1Mコンテキストが利用可能で、エージェントが長期的なタスクの計画・実行・検証を一貫して行える。最大出力トークンも128,000と大容量だ。

コーディング性能ではSWE-Bench Proで57.7%を達成し、GPT-5.3-Codex(56.8%)を僅差で上回った。GPT-5.3-Codexの強みをそのまま引き継ぎつつ、推論・ツール操作・業務タスクにも対応範囲を広げたのがGPT-5.4の位置づけだ。

GPT-5.4 mini・nano──3月17日に追加投入

OpenAIは3月17日、GPT-5.4の小型バリアントであるGPT-5.4 miniとGPT-5.4 nanoをリリースした。Inc.の報道によると、GPT-5.4 miniはフラッグシップモデルに近い性能をはるかに低コストで提供する。Codexでは新しいファストモードも導入され、対応モデル全体で最大1.5倍の速度向上が実現した。

開発者にとっては、精度が必要な場面ではGPT-5.4、速度とコストを重視する場面ではGPT-5.4 miniという使い分けが可能になった。特にエージェント型ワークフローで大量のAPIコールが発生するケースでは、miniモデルのコスト効率が大きなメリットとなる。

料金体系と利用可能プラン

項目 GPT-5.4 GPT-5.4 Pro
入力料金 $2.50 / 1Mトークン $30.00 / 1Mトークン
キャッシュ入力 $0.25 / 1Mトークン
出力料金 $15.00 / 1Mトークン $180.00 / 1Mトークン
コンテキスト上限 最大105万トークン
最大出力 128,000トークン
ChatGPT利用 Plus / Teams / Pro Enterprise / Edu

注意点として、入力が272,000トークンを超えると入力料金が2倍、出力料金が1.5倍になる。100万トークンのコンテキストをフル活用する場合はコストが跳ね上がるため、用途に応じた設計が必要だ。

主要ベンチマーク比較

ベンチマーク GPT-5.4 GPT-5.3-Codex GPT-5.2
SWE-Bench Pro 57.7% 56.8%
OSWorld 75.0%
HOAポータル初回成功率 95% 73〜79%(CUA)
事実精度(虚偽率) GPT-5.2比 -33% 基準

GPT-5.4はコーディング特化モデル(GPT-5.3-Codex)を僅差で上回りながら、computer-use・事実精度・トークン効率でも改善を達成した。「専門モデルの強みを汎用モデルに統合する」というOpenAIの戦略が明確に表れている。

Aitly編集部の見解──「統合」がキーワード

Aitly編集部 コメント

2026年3月18日時点の分析

GPT-5.4の本質は「統合」だ。コーディング特化のGPT-5.3-Codex、computer-use専用のCUAモデル、長文対応──これまで別々に提供されていた能力を1つのモデルに集約した。開発者は用途ごとにモデルを切り替える必要がなくなり、エージェント設計がシンプルになる。

一方で、272Kトークンを超えると料金が跳ね上がる価格設計や、computer-useがAPI・Codex・Enterprise限定である点は、個人開発者や中小企業にとってハードルが高い。GPT-5.4 miniの投入でコスト面の選択肢は広がったが、computer-use機能がminiでどこまで使えるかは今後の検証が必要だ。競合のClaude Opus 4.6やGeminiとの比較も含め、エージェント時代の「標準モデル」の座をどこが取るかは2026年最大の注目点になるだろう。

よくある質問

GPT-5.4は無料で使えますか?
ChatGPTの無料プランでは利用できません。GPT-5.4 Thinkingとして利用するにはPlus($20/月)、Teams、またはProプランへの加入が必要です。API経由では従量課金(入力$2.50/1Mトークン、出力$15.00/1Mトークン)で利用可能です。
GPT-5.4のcomputer-use機能はChatGPTから使えますか?
2026年3月時点では、computer-use機能はAPI、Codex、Enterprise/Eduプランに限定されています。ChatGPT Plus/Proのチャット画面からは直接利用できません。Codex経由でのアクセスが最も手軽な方法です。
GPT-5.4 miniとGPT-5.4の違いは何ですか?
GPT-5.4 miniはフラッグシップのGPT-5.4に近いコーディング・エージェント性能を、大幅に安い料金と高速なレスポンスで提供する小型モデルです。精度重視ならGPT-5.4、速度・コスト重視ならGPT-5.4 miniという使い分けが推奨されます。3月17日にCodexとAPIで利用可能になりました。
GPT-5.3-CodexからGPT-5.4に乗り換えるべきですか?
コーディング用途のみであれば、SWE-Bench Proのスコア差は僅か(57.7% vs 56.8%)のため急ぐ必要はありません。ただし、computer-useやツール操作、業務タスクの自動化も視野に入れるなら、GPT-5.4への移行メリットは大きいです。トークン効率の改善もあり、同じタスクでもコストが下がる可能性があります。

まとめ

GPT-5.4は、OpenAIが推論・コーディング・エージェント型ワークフローを1つのモデルに統合した集大成だ。ネイティブcomputer-useで初回成功率95%、100万トークンコンテキスト、SWE-Bench Pro 57.7%と、いずれも実用水準に達している。3月17日にはGPT-5.4 mini・nanoも追加され、コストと速度の選択肢も広がった。

「AIモデルを用途ごとに切り替える」時代から「1つのモデルにすべてを任せる」時代への転換点として、GPT-5.4のリリースはAI業界全体にとって重要なマイルストーンだ。今後はcomputer-useの一般ユーザー向け開放や、競合モデルとの性能比較に注目していきたい。