😋

Open AI GPT-4o mini誕生 爆速でした!

2024/07/19に公開

GPT-4o miniが誕生!

朝起きたらOpen AIからメールが。
GPT-4o miniがリリースされたそうです。
https://openai.com/index/gpt-4o-mini-advancing-cost-efficient-intelligence/

GPT-4o miniは現時点で、「最高性能かつ効率の良い小規模モデル」とのこと。
5月にリリースされて、その処理速度と精度で話題になったGTP-4oの軽量化バージョンであり、GPT-3.5-turboの代替になるのではと言われています。
また、マルチモーダルも対応予定とのことで、将来的にテキストだけではなく、画像、ビデオ、オーディオも入出力可能となりそうです。

もう少し記事を読んでいきましょう。

Open AIの記事を読み解く

GPT-4o miniの概要

OpenAIは、最もコスト効率の高い小型モデル「GPT-4o mini」を発表した。このモデルは、AIをより手頃な価格で提供し、幅広いアプリケーションでの利用を促進することを目的としていまとしている。GPT-4o miniは、MMLUで82%のスコアを達成し、GPT-4を上回るパフォーマンスを示している。

-> なので、GPT-4oには精度が劣るが、GPT-4を上回ると読み取れそうです。

価格と利用可能性

価格: 入力トークン1Mあたり15セント、出力トークン1Mあたり60セントで提供されており、以前のフロンティアモデルと比べて一桁安く、GPT-3.5 Turboよりも60%以上安価となる。

利用可能性: GPT-4o miniは、Assistants API、Chat Completions API、およびBatch APIで利用可能。ChatGPTのFree、Plus、およびTeamユーザーは即日利用可能で、来週からはエンタープライズユーザーも利用可能となる。

機能と性能

テキストとビジョンのサポート: 現在、テキストとビジョンをサポートしており、将来的にはテキスト、画像、ビデオ、音声の入力と出力もサポート予定だそう。

コンテキストウィンドウ: 128Kトークンのコンテキストウィンドウを持ち、2023年10月までの知識を有している。

多言語対応: GPT-4oと同じ範囲の言語をサポートし、非英語テキストの処理がさらにコスト効果的。

モデル評価

学術ベンチマーク: GPT-4o miniは、GPT-3.5 Turboや他の小型モデルを凌駕し、テキストインテリジェンスとマルチモーダル推論の両方で優れたパフォーマンスを示している。

関数呼び出し: データ取得や外部システムとのアクションを行うアプリケーション構築に役立つ強力な性能を示している。

安全性

安全対策: モデル開発の初期段階から安全性が組み込まれており、ヘイトスピーチや成人向けコンテンツ、スパムなどの情報をフィルタリングしている。

強化学習: 人間のフィードバックを用いた強化学習(RLHF)を通じてモデルの応答の正確性と信頼性を向上させている。

新技術の採用: インストラクションヒエラルキーを用いて、モデルの応答の信頼性を高め、セキュリティリスクを軽減している。

-> インストラクションヒエラルキーは、2024年4月にOpen AIが論文を発表しています。
https://arxiv.org/pdf/2404.13208

-> LLMへインプットする情報の優先順位をシステムプロンプトを最大にすることで、プロンプトインジェクション、ジェイルブレイク、システムプロンプト抽出などの攻撃に対するLLMの脆弱性を軽減することができるそうです。Open AIのGPTsなどで公開したアプリのプロンプトがばれてしまうリスクが軽減できそうです。

今後の展望

コスト削減と能力向上: 過去数年間でAIのコストは大幅に削減され、能力は向上している。GPT-4o miniのトークンあたりのコストは、2022年に導入されたtext-davinci-003と比較して99%減少している。

未来のビジョン: AIモデルがあらゆるアプリやウェブサイトにシームレスに統合される未来を目指している。GPT-4o miniは、より効率的かつ手頃な価格で強力なAIアプリケーションを構築・スケールするための道を開いている。

速度比較サイトを確認してみる

さっそく更新されていて、GPT-4o miniも比較対象になっています!
https://artificialanalysis.ai/

SpeedはGemini1.5Flashに引けを取らず、品質もそこそこといった形になっています。

コストを比較してみる

GPT-4oが100万トークンあたりInput$5、Output$5に対して、GPT-4o miniは100万トークンあたり$0.15、Output$0.6となっています。GPT-4o miniはGPT-4oに比べて3%の価格となっています。
また、GPT-3.5turboは100万トークンあたりInput$0.5、Output$1.5となっておりGPT-3.5turboと比較しても30%の価格になっています。価格破壊ですね。


また、Gemini1.5Flashと比較しても、Gemini1.5FlashはInput$0.35なので、GPT-4o miniは約半分のコストとなっています。

https://openai.com/api/pricing/
https://ai.google.dev/pricing?hl=ja

実際の速度を体感してみる

同じ質問をした場合のGPT-4oとGPT-4o mini、Claude 3.5 Sonnetの違いを見てみましょう。

質問文

下記アクセンチュアの事業概要、決算、市場からの評価をもとに、直面している課題とどのように課題解決していくべきかアイディアをください。200文字程度で回答してください。
"""
アクセンチュア(Accenture)は世界最大級の総合コンサルティング企業で、主に以下の5つの事業領域でサービスを提供しています:
1. ストラテジー & コンサルティング: 経営戦略や業務改善のコンサルティング
2. テクノロジー: クラウド、AI、ブロックチェーンなどの最新技術を活用したソリューション開発・提供
3. オペレーションズ: 企業の業務プロセスのアウトソーシングサービス
4. インダストリーX: デジタル技術と製造業の専門知識を組み合わせたサービス
5. ソング(旧デジタル): デジタルマーケティングやアナリティクスなどのデジタル関連サービス
直近の決算と市場評価については:
2024年5月期第3四半期(2023年12月~2024年2月)の決算では:
- 売上高は157億9951万4000ドルで、アナリスト予想を下回りました[11]。
- EPSは3.13ドルで、前年同期比1.9%減少し、アナリスト予想を0.6%下回りました[11]。
市場からの評価:
- 決算内容は市場予測をわずかに下回りましたが、生成AI関連の契約増加がポジティブに評価され、決算発表後の株価は上昇しました[5]。
- アクセンチュアは、デジタル変革やAI導入支援などの分野で強みを持つことが評価されています。
- 2023年度(2022年9月~2023年8月)の売上高は641億ドルで、前年比4.1%増加しており、安定した成長を続けています[3]。
総じて、アクセンチュアは技術革新やデジタル化の波に乗り、安定した成長を続けている企業として市場から評価されています。特に生成AIなどの最新技術への取り組みが注目されており、今後の成長が期待されています。

GPT4-o

出力結果
アクセンチュアは安定した成長を続けていますが、直面している課題としては売上高とEPSのアナリスト予想を下回ったことが挙げられます。この課題を解決するためには、以下の戦略を取るべきです:
新技術へのさらなる投資:生成AIやクラウド技術など成長が期待される分野への投資を強化し、新規契約を増やす。
効率的なオペレーションの推進:業務プロセスの自動化と効率化を図り、コスト削減と業績向上を目指す。
顧客ニーズの深掘り:クライアント企業のデジタル変革支援をさらに強化し、差別化されたサービスを提供することで顧客満足度を高める。

GPT-4o mini

出力結果
アクセンチュアは最新技術に強みを持つ一方、決算が予想を下回り、成長の加速が求められています。直面する課題は、収益性の向上と予測精度の改善です。解決策として、生成AIを活用し、より効率的なプロジェクト管理や顧客ニーズの予測精度を向上させることが考えられます。また、戦略的なM&Aを通じて新たな市場や技術領域へのアクセスを強化することも有効です。

回答結果が短く一瞬だったので、回答文字数の指示を200文字->500文字に増やして再度動かしました。

出力結果
アクセンチュアは、広範なサービス領域と安定した成長を誇る企業ですが、以下の課題に直面しています:
売上高の予測下回り: 直近の決算では、売上高が予測を下回り、EPSも前年同期比で減少しました。これは、特定のプロジェクトや契約の遅延、または市場環境の変化が影響している可能性があります。
技術進化への対応: 生成AIやデジタル技術の急速な進化に追随し続けることが求められています。技術革新に遅れをとると、市場競争力を失うリスクがあります。
課題解決のアイディア:
売上向上のための市場戦略の見直し: 顧客ニーズの変化や新興市場の動向を反映させた新たなサービスラインの開発を行い、売上の増加を図ります。また、既存顧客との関係強化やクロスセルの推進も有効です。
技術革新のリーダーシップを強化: 生成AIやその他の先進技術分野におけるリーダーシップを確立するため、研究開発への投資を増加させるとともに、業界最先端の技術を積極的に取り入れるべきです。技術パートナーシップの形成や、業界との連携強化も検討する価値があります。
プロジェクト管理の強化: プロジェクトのタイムラインや予算の管理を徹底し、予測を下回るリスクを最小限に抑えるための体制を整えることが重要です。これにより、契約の遅延や利益率の低下を防ぎます。
これらの施策により、アクセンチュアは今後も市場での競争力を維持し、成長を続けることができるでしょう。

Claude 3.5 Sonnet

出力結果
アクセンチュアの直面する主な課題は、急速に進化するテクノロジー環境への適応と、人材の確保・育成です。AIやクラウドなどの最新技術に関する専門知識を常に更新し、クライアントに最適なソリューションを提供し続ける必要があります。また、グローバルな人材獲得競争の激化に対応するため、魅力的な職場環境の創出と継続的な教育プログラムの強化が重要です。これらの課題に対し、社内の技術研修制度の拡充、スタートアップとの戦略的提携強化、そして柔軟な働き方を促進する企業文化の醸成に取り組むべきでしょう。

GPT-4o miniは初速で若干止まりましたが、そのあと一気にテキストが生成されましたね。
少ないサンプルの中だが、回答内容もさほど違和感ないです。

さいごに

ChatGPT-4miniは可能性を秘めていると考えています。
処理速度が向上したことにより、「リアルタイム言語翻訳」が進んだり、教育現場における「インタラクティブな個別指導」が実現できたり、医療分野で「患者の症状や検査結果のリアルタイム分析」が実現できたり、といった可能性があると考えています。
引き続き、生成AIの進化を日々追いながら、具体的なユースケースもアイディア出しできたらと考えています。

Accenture Japan (有志)

Discussion