🔥

【Phi-3とは】Phi-3の特徴と活用方法をまとめてみた

2024/06/15に公開

はじめに

この記事では、Microsoft Build 2024でもアップデートが発表された小型言語モデル「Phi-3」の特徴を分かりやすく紹介していきます。
また、このPhi-3をビジネスでどのように活用できそうか、アイデアのブレストも行ってます。
※アイデアは参考程度にご覧ください。

Phi-3の特徴

Phi-3とは

Phi-3とは、Microsoftが開発した小型の言語モデル(SML:Small Language Model)です。サイズが小さいためコスト効率がよく精度としても高性能というコスパの良いモデルになっているのが最大の特徴です。
同じサイズの言語モデルや、一回り大きいサイズの言語モデルと比較すると
・コーディング
・推論
・言語能力
・数学
のベンチマークでPhi-3の方が高い精度を叩き出していることが実験で判明しています。

これによりお客様により効果的なモデルを提案する選択肢が増えたとMicrosoftは語っているようです。

Phi-3のモデルの種類

Phi-3にはシリーズがあり、小さい順に

  • Phi-3-mini(3.8B)
  • Phi-3-vision(4.2B)
  • Phi-3-small(7B)
  • Phi-3-midium(14B)

というモデルがあります。visionモデルのみマルチモーダルに対応していますが、それ以外は言語のみの対応です。
Phi-3-visionは、チャートやダイアグラムを分析し洞察することも可能です。抽出されたテキストに対する推論、OCR、図などを理解するタスクに最適化されています。
以下の画像は、世代別のAIツール使用状況を表したチャートから言えることをレポートにまとめるながれをPhi-3-visionに任せた時の画像です。
各世代ごとにどれくらいの割合の人が使っているか、そこからどんなことが言えるかを端的にまとめてくれています。

これらのモデルはAzure AI StudioのモデルカタログやHugging Faceから利用可能です。ぜひお試しください。

https://ai.azure.com/explore/models?&selectedCollection=phi
https://huggingface.co/collections/microsoft/phi-3-6626e15e9585a200d2d761e3

SLM(小規模言語モデル)だと何が良いの?

Phi-3は小型だ、軽量だと言われていますが、小規模であるメリットは何でしょうか。
このPhi-3を始めとするSLM(Small Language Model)は単純なタスクに対して優れた性能を発揮するように設計されています。
そのため予算や通信環境などのリソースが限られている組織にとってアクセスしやすく使いやすいものになっています。
小型である分、応答も速いです。
また、小型であるが故にデバイス上でも動かすことができます。ローカルで実行される必要があるアプリケーションに生成AIを組み込みたいときにはぴったりです。

Phi-3の強み

上記をまとめると、Phi-3モデルの強みは以下3つといえるでしょう。

  1. 小型モデルであるため処理速度が速い
  2. 軽量なのに、同じサイズのモデルや一回り大きいモデルと比較して精度が高い
  3. 接続制限がある環境やオフライン環境でも運用が可能

Phi-3が生きる場所は?

特徴や強みをもとに、自分なりにPhi-3をビジネスでどのように活用できそうか考えてみました。
ジャストアイデアなので、とりあえずざっくばらんに記載しています。

  • 自動車に搭載し、なにかの指示を口頭で行えば生成AIが回答をしたり処理を実行したりする。
    • 地図上で目的地まであと何分かかるか、駐車場は近くにあるか、などの回答を生成
    • 外付けカメラと連動して、「子供が多いので注意して走行してください」といった注意喚起
  • 倉庫や工場などネットが使えない環境で、操作マニュアルなどのRAG検索。音声認識と合わせれば、一人に1つのAIエージェントが常にいて、わからないことを聞けば都度答えてくれるため、手順がわからなくて作業が滞ることがなくなる?
  • 物流系の企業が抱える課題になにか使えそう。在庫管理とか棚卸しとか。
  • 動画を分析して、危機感地を行ったり安全性確保、メンテナンスが必要ではないかという示唆出しをする(AIの異常検知をトリガーに、生成AIが動画を分析、こんなことがあったとリアルタイムでお知らせ?)
  • 通信の制限や個人情報などのセキュリティ要件が厳しい病院での生成AI活用にもつながるか?
  • コールセンターのオペレーターAIなど、リアルタイムでのやりとり、スピード感が求められるものに使う(gpt-4oで良さそうだが。)
  • NVIDIA社のJetsonなど、エッジデバイスに組み込んで生成AIを使う。
    • プールの監視カメラに生成AIを導入し、注意喚起やアラートを伝えてくれる使い方もできるか
  • 家電などIoTデバイスに組み込めそう
    • ルンバなどのお掃除ロボに、「この部屋掃除してほしい」と言えば動いてくれる
    • 炊飯器に搭載して、「〇〇時にご飯を炊いておいて」と口頭で話せば予約してくれる(生成AIではなくてもいけるか)
  • アレクサやパソコンに組み込めばジャーヴィス(詳しくはアベンジャーズ、アイアンマンを御覧ください)を作れるのでは?
  • 抽象的だけどデータを自社内で保持したい企業や組織に対して生成AI導入のアプローチをする際に利用できそう

参考記事

https://azure.microsoft.com/en-us/blog/new-models-added-to-the-phi-3-family-available-on-microsoft-azure/

https://azure.microsoft.com/ja-jp/products/phi-3/

https://news.microsoft.com/source/features/ai/the-phi-3-small-language-models-with-big-potential/

ヘッドウォータース

Discussion