GPT-4oを発表! 高速応答で音声・画像・テキストにも対応!

最新のAIモデル「GPT-4o」を発表!

テキスト・音声・画像をシームレスに扱え、かつ高速な応答が特徴!

全てのChatGPTユーザーに提供開始!

テキスト・音声・ビジョン対応のGTP-4o!

GPT-4レベルのインテリジェンスを持ちながら、より高速で、テキスト・音声(Voice)・視覚(Vision)のそれぞれの機能を向上させた最新のフラッグシップモデル!

・ユーザーが共有する画像を理解し、会話・議論でき、異なる言語で書かれたメニューの写真を撮影し、GPT-4oに話しかけて翻訳できる!

・料理の歴史や意義について学ぶ、おすすめの料理を教えてもらったり!

Say hello to GPT-4o

将来的には、自然なリアルタイムの音声会話や、リアルタイムの動画でChatGPTと会話できるといった使い方にも対応予定!

ChatGPTにスポーツの試合中継を見せて、ルールを説明してもらったり!

Realtime Translation with GPT-4o

GPT-4oの[o]はomniの略!

自然な人間とコンピュータのインタラクションへの一歩!

テキスト・音声・画像の組み合わせを入力でき、同様にテキスト・音声・画像での出力に対応!

音声入力に対しては最短232ミリ秒、平均320ミリ秒で応答可能!

従来のGPT-4より大幅に高速化!

会話における人間の応答時間にほぼ等しい!

GPT-4oは、英語とコードのテキストでGPT-4 Turboの性能に匹敵し、非英語言語のテキストも大幅に改善!

APIもはるかに高速で50%安価!

特に視覚と音声の理解において優れている!

既存のモデルとの大きな違いは、音声モードでトーン、複数の話者、背景のノイズなどを理解する!

人間のような感情表現や振る舞いも

・無料版のChatGPT Freeは利用制限がある!

・有料のPlus(20ドル)ユーザーは無料ユーザーの5倍のメッセージを利用可能!

・TeamとEnterpriseユーザーはさらに多く利用可能!

GTP-4oでは!

回答をモデルとWebから取得可能で、データの分析やグラフの作成にも対応!

撮影した写真についてチャットできるほか、ファイルをアップロードして、要約、執筆、分析などが行なえ!

ファイルはPDFやCSV、Wordなどに対応!

GPTで作成したアプリのGPTsやGPT Storeも利用可能!

Introducing GPT-4o

ChatGPTのデスクトップアプリも登場(Mac)

新たなChatGPTデスクトップアプリもmacOS用に提供開始!

キーボードショートカット(Option + Space)で、即座にChatGPTに質問できるほか、アプリ内で直接スクリーンショットを撮り、議論できる!

スクリーンシェアしたコードのレビューや!気温の推移のグラフ(画像)について、最も温度が高い月を聞くと音声で応答!

グラフの趣旨やY軸の意味などについても音声で回答!

新デザインのルック&フィールを導入!

新しいホーム画面やメッセージのレイアウトとし、より会話しやすく親しみやすいデザインに!