🧭

Microsoft Build 2024に参加して今後のAIを占う

2024/06/21に公開

Microsoft Buildについて

Microsoft Buildは、Microsoft社の年次イベントで開発者向けの内容になっています。2024年は本社があるシアトルで開催されました。現地への参加者は4000人以上でした。年次のMicrosoft Igniteよりは小規模ですが、その分エンジニアに振っているので内容は面白かったです。来年以降参加する人向けに情報を少しまとめます。

  • 場所
    開催場所はシアトルコンベンションセンター(Summit)でした。ダウンタウンの中心なのでロケーションはいいと思います。センターは1つだけなので移動は楽でした。ラスベガスみたいにホテル間移動が大変ということはありません。

  • ホテル
    洒落にならないくらい高いです。安めのホテル(それでも三ツ星)に泊まりましたが壁が薄かったです。ベッド横に耳栓が置いてあって最初はよくわかりませんでしたが、察しました。。。

  • ランチやおやつ
    時間になると用意されます。ランチボックスは期待してませんでしたが、かなりおいしかったです。ビーフ、チキン、ビーガンメニューの3つがあって、それらを選んで適当な場所で食べます。あと、コーヒーはシアトルだからかスタバでした。結構満足度高いです

  • 治安
    極めていいと思います。米国の中ではシアトルとボストンがかなりいいと思います。もちろん油断してはダメだと思いますが、ゴミもほとんど落ちてないし綺麗な街並みです

  • 打ち上げ
    たいていのイベントでは最終日の夜に打ち上げイベントがありますが、アメフトのスタジアムで開催されました。ホットドックやフライなどは自由に食べられるのとビールも飲み放題なので、お酒が強い人は楽しいと思います。

さて、掴みはこれくらいにして具体的な中身を書いていきますね。全部は書ききれないので要点をまとめていきます。

Copilot Stack

今回のセミナーで印象的だったのが、Copilot Stackです。概念の整理にはなりますが、図を見て頂いたほうが早いと思います。

※Microsoft Buildの資料を引用

インフラ(AI Infrastructure)、データ(Your data)、モデル(Foundation models→LLMのこと)、オーケストレーション(AI orchestration and toolchain)をAzureが支え、Microsoft Copilotなどと連携していく世界観です。右のほうのXXX Studio系の製品もここに連携しています。このように比較的ユーザーに近いところから使いやすいトータルパッケージとしての提供がMicrosoftの強みと言ってもいいかもしれません。もともとはWindowsOSからはじまり、Office製品を中心に発展してきたMicrosoftが、OpenAI社と手を組んだことで飛躍したと思います。個人的には、LLMの世界をOpenAIに任せたことで、周辺に経営資源を投入したMicrosoftの戦略は非常に合理的だと思います。サティア・ナデラの功績だとも思います。

以降はレイヤーごとに解説していきます。

インフラ

スタックのボトムから説明していきます。インフラですが、ちょうどGPT-4oが発表された直後だったのでその発表と、Azure Cobalt(独自Arm)が取り上げられていました。Azureだけでないですが、時代はArmに移行しつつあるのだなと感じます。
ちなみに、インフラに関してですが、「Inside Microsoft AI innovation」のセッションはとてもよかったのでオススメです。これはアーカイブもあると思います。CTOのMark Russinovichさんが話していましたが、サーバー、ネットワーク、ストレージについて詳しく説明されていました。「Project POLCA」や「Storage Accelerator、Global scheduler」の説明あたりは良かったです。長くなるので今回は割愛しますので、興味ある方は動画を観てみてください。

データ

データに関してはMicrosoftがある意味最も力を入れている領域という印象を持ちました。先ほどLLMはOpenAIに任せて、と書きましたが、それを活かす本丸はデータだからです。ChatGPTの回答性能、特にRAGはAzure Cosmos DBが支えていますし、これまであったサービスとうまく組わせているのが印象的でした。キーノートでもデータはLLMの燃料と言っていましたし、データがなければいくらいいLLMを使ったところで何も得られません。
また、今回大きな注目を集めていたのがFabricというサービスです。詳細は後段で説明しますが、AIを狙い撃ちしたこのパッケージは強力だと思います。
その他の注目点としてはsnowflakeとのアライアンスだと思います。ある意味Fabricと競合する部分もあると思いますが、細かいことは気にせずに一気に拡大と成長を狙う戦略には凄みを感じます。このようにデータ関連を俯瞰してみると、Microsoftがいかに力を入れているかが見て取れます。

※Azure Cosmos DBについてはDiskANNなどまだ書きたいことはありますが割愛します

モデル

先ほども記載しましたが、GPT-4oの発表と重なったこともあり、多くのセッションで取り上げられていました。また、Models-as-a-Serviceもアナウンスされていて、OpenAI一辺倒ではない点も重要だと思います。もちろん売りというか核の部分はOpenAIかなと思いますが、幅広くニュートラルな選択も可能です。
なお、Phi-3に関してもいくつか発表がありましたが、センセーショナルな感じはそれほどなく、正常進化という印象を持ちました。

オーケストレーション

データの次に重要だなと思ったのがオーケストレーションです。データがLLMにとって不可欠な燃料であれば、オーケストレーションはそれらを統合コントロールする頭脳の部分かなと思います。頭脳というとAIなのでLLMでは?と思うかもしれませんが、AI全体の世界観をコントロールするという意味でオーケストレーションは大事ですし、ある意味”人間の能力を一番使う領域”という印象を持っています。文字通り人間が脳を使う部分だから「頭脳」という感じです。
では、人間がどこで力を発揮すべきかと言えば、AIを使うことで目的を達成する速さと正確さを担う、つまり工夫する部分になります。今年に入って、この速さと正確さがトレンドというか主戦場になっていて、ここを効率的に高める戦略が極めて重要です。LLMOpsの実行を担う部分といったほうが正確かもしれません。
この課題に対してのMicrosoftの解が「Visual Studio」や、「GitHub Copilot」や、「Copilot Studio」などのツール群です(Azure AI Studioもですが、次で解説します)。これらのツールを使いこなして、スピードアップを図るのがトレンドであり、Microsoftが狙っている世界観になります。

AI Studio

AIに必要なものを統合したのがAI Studioです。


※Microsoft Buildの資料を引用

モデルの選択(API and model choice)、AIのチェーン(Complete AI toolchain)、AIを安全に利用すること(Responsible AI tools & practices)、本番環境で使えるようにすること(Enterprise-grade production at scale)が大きなポイントになっていきます。

モデルの選択

まず、モデルの選択ですが、OpenAIのモデルを軸としつつも、API連携でさまざまなものを利用できる世界観になっています。現状では精度が最優先ですが、モデルが細分化され徐々に適材適所が求められる感じになっていくでしょう。一芸に秀でたモデルが出れば入れ替えることもあるでしょうし、安いモデルが出れば乗り換える必要も出てきます。この流れはかなり短いサイクルになります。恐らく半年単位でモデル入れ替えが当たり前という感じです。そうなってくると、今のシステム開発のように5年使って償却していくものとは全く異なった世界観になります。我々はそういう世界に足を踏み入れていると認識すべきでしょうし、会計処理も含めた見直しが必要だなという印象を持っています。そういうスピードを支える一面がAI Studioにはあります。

チェーン

次はチェーンです。Microsoftとしてチェーンを担っているのがSemanticKernelにはなりますが、さまざまなセッションを受講していて思うのは、何が何でもSemanticKernel推しではないということです。この界隈ではLangChainのほうが有名ですが、LangChainを利用するセッションがいくつもありました。Microsoftの立場としては自社のSemanticKernelが広がったほうがいいのでしょうが、現状ではニュートラルなポジションをとっているという印象です。
また、いくつかのセッションで見かけたPromptyも重要です。

簡単にいえばプロンプトのフォーマット化です。はじめ見かけたときに知らなかったのですぐ検索しましたが、あまり情報がネット上にもありませんでした。GitHub上に情報はあるので理解はできたのですが、当たり前のようにいくつかのセッションで話されていたので、ご存じない方は絶対にチェックしたほうがいいと思います。このロゴを目印にしてください。

ちなみに、蛇足にはなりますが、サンフランシスコにも移動してLangChainの方にも話を伺ってきたので、フレームワーク界隈の話は別に書いてみようと思います。

AIの安全利用

次にAIの安全性に関してです。これもいろいろなセッションがあって興味深かったですが、「ソフトウェアの考え方に近い部分」と、「違う部分」があります。ソフトウェアに近い部分はSBOMのように、構成要素を管理するイメージです。怪しいコンポーネントやデータやプロンプトが紛れ込まないようにプロセスコントロールします。それはAI Studioが得意な部分です。まだ出たばかりなので、現状できなかったとしても正常進化が期待できると思います。
一方で(ソフトウェアと)「違う部分」と書いたほうですが、いろいろな方法で不正なAI利用を狙うことができます。例えば、プロンプトで意図的にAIを不正操作するようなこともできますが、そういうケースはAI Studioではカバーできない部分が出てきます。ここはAI利用のユースケースを分類して考えていく必要がありますが、長くなってしまうので割愛します。Responsible AIの意図は責任を持った回答をする、つまり安全にAIを使うことですが、奥深いですし新しい概念整理も必要です。

本番環境としての利用

最後の本番環境での利用ですが、これはスピードを得るために必要なものだと私は理解しています。普通のシステムだと開発環境と本番環境を分けて厳密に管理しますが、どうしても分離することで、デプロイまでのスピードが落ちてしまいます。全く違う価値観になってしまうかもしれませんが、本番と開発の両方の環境がかなり近い世界観があり、Microsoftはそこに応えようとしています。どういうシステムだとそれが可能なのかは考える必要がありますが、少なくともそういうものが必要になってくるという変化の流れは感じました。

Fabric

次に今回注目されていたFabricの解説をします。

まず、Fabricの世界観ですが、図のようなイメージになります。右上でくくられている部分がFabric本体です。もともとは分析計ツール(主にBIツール)から発展していますが、データパイプラインやETLなどの連続処理も含まれています。

※Microsoft Buildの資料を引用

データソースには様々なものが可能で、Azureにあるものであれば(左上)ミラーリングして取得できます(ショートカットというパターンもありますが、レイテンシーを気にすることもあると思うので、ケースバイケースになっていくとは予想します)。また、API経由でも取得できます(左の真ん中)。その他下段はこれまでAzure外だった部分の連携です。Snowflakeやsalesforceもそうですし、他のクラウドやオンプレ連携も可能になっていきます。

これらの連携の受け先になるのがOneLakeと書かれている部分です。要するに外部連携したデータを取り込んでデータレイクにしていくという戦略なのですが、これまでAWSが取ってきたS3の戦略に似ているとも言えます。当然ですがデータグラビティを狙っているので(後述)、利用者は注意が必要です。

リアルタイム連携

この手のデータレイクに対してのデータ連携の話が出てくると必ず登場するのがリアルタイム連携です。Fabricでも当然のようにこのニーズには応えていて、Real-Time hub を経由して取得する構成になっています。


※Microsoft Buildの資料を引用

コネクタの種類の豊富さや、Azureサービスとの親和性はこれからどんどん進化すると思います。また、snowflakeやDatabricksとの連携のしやすさも使い勝手を加速させると思います。当然ですが、前述のAzure AI Studioとの連携は容易になるので、データプラットフォームとLLM利用が加速します。

データグラビティについての考察

古くはOracleのデータグラビティが強力でした。ミッションクリティカルなシステムを組む場合は必然的にOracleに吸い寄せられました。その後、クラウド時代に突入しAWSのS3のデータグラビティが強力になります。S3の最大のメリットは使いやすさだと思います。そしてそこから新しい時代にまた変わりはじめているのでは、と感じました。

正直なところ、Fabricはかなり強力ですし便利です。ただ、逆の言い方をすると想像の範囲内というか、これまで全くなかったものを生み出している訳ではないと思います。正常進化を高いレベルで達成しているだけともいえます。それなのになぜFabricが良さそうに映るかと言えば、LLM(OpenAI)を利用する上での親和性が高いからだと思います。そういう意味では、データグラビティの時代からLLMグラビティの時代に移り変わろうとしているのかもしれません。

とはいえ、LLMの領域はまだまだ未知数です。現状ではOpenAIが抜けていると思いますし、そこに吸い寄せられるようにsnowflakeなどが接近しています。最近ではAppleも提携しましたので、OpenAIの強さが感じられます。ただ、まだまだ変化が激しい領域なので、当面は方向性を良く見定める必要があると思います。あくまでも私の感覚でしかないですが、あと1,2年は、このままOpenAIが走り続けるのか、強力なライバルが出てくるのかは見ていく必要があると思います。今年の冬のMicrosoft IgniteやAWS re:inventは注目ですし、方向性を占う上で要確認だと思います。

最後に

今回Microsoft Buildに参加して思ったのは、Microsoftの提唱する世界観には抜けているポイントが無いということです。利用者サイドの使い勝手から、データ、AIに繋げる部分をほぼ網羅していると思います。この辺は、はじめにも書きましたがPCやOfficeというバックグラウンドがあるMicrosoftの強みですね。AWSはIaaSから発展した会社なので、どうしても上流部分が弱い気がします。逆にMicrosoftの世界観で抜けている部分があるとすればモバイルです。キーノートでCopilotPCの話を大々的にしていましたが、主戦場ってPCじゃなくてモバイルじゃないのかなと思っていました。その部分には触れない感じの構成になっているので、どうなのかなと思っていましたが、AppleがOpenAIと接近したことで、もしかするとうまくピースがはまるかもしれないですね。今後の動向から目が離せません。

最後に、メンバーに加わったつもりで写真を撮ってきました。

Discussion