Claude MCP 入門
🙂はじめに
2024年11月26日にAnthropicからリリースされたMCP(Model Context Protocol)について改めて解説していこうと思います。
MCPは、AIとデータソースやサービスとを簡単に繋げられる仕組みです。
特にPC上のファイル操作ができるということでSNSを中心に話題になっています。
MCPがリリースされた約1か月前にClaudeのDesktop版がリリースされています。
その時は、それほど大きな話題になっていなかったのですが、今思えばMCPを見据えたものだったのかなと思います。
🤔生成AIアプリの全体像
本題に入る前に、Claudeをはじめとする生成AIアプリの全体像を見ていきましょう。
MCPだけに注目してもこのインパクトがなかなか伝わらないと思ったからです。
生成AIアプリって?
世の中に生成AIアプリが日々乱立していますが、そもそも生成AIアプリってどのような変遷を辿ってきたのでしょうか。また、どのような技術要素が組み合わさって成り立っているのでしょうか。
まず生成AI(LLM)とは
まずは生成AI自体の話しになりますが、生成AIはインターネット上に存在する情報を分析して、人間が使う言葉を確率してモデル化したものとなります。生成AIは人間の問いかけに回答してくれますが、インプットはインターネット上の情報となります。また、どのように回答を生成しているかというと、ある単語に対して次にくる単語の候補のうち確率が高いものを選別して次々に文字列を生成します。これを追究していった結果ChatGPTやClaude、Geminiのような生成AIができあがったと言われています。
概念
さて、みなさんが普段ブラウザで使っているChatGPTやClaude、Geminiですが、厳密に言うと生成AIだけでなりたっている訳ではありません。例えば画像生成やWeb検索といった機能は別の技術を使っています。つまり生成AI+別の技術で成り立っています。
2022年11月にOpenAIからChatGPT3.5がリリースされたのですが、その時は生成AIのみの機能しか有していませんでした。その後、生成AIが注目されて世界中の技術者が様々な追加機能を開発していきます。その中でも有名なのがRAG(Retrieval-Augmented Generation)です。生成AIはある時点のインターネット情報をインプットに学習しているため最新の情報やインターネットに存在しない企業の業務情報は保持していません。RAGを使うことによって、インターネットに存在しない情報もインプットして生成AIが回答できるようになりました。
また、API(Application Programming Interface)を使って様々な外部サービスと連携できるようになりました。例えば最新の天気やニュースも生成AIと連携することで回答することができるようになりました。
このように、生成AIだけではなくRAGや外部サービスといい感じに連携したサービスを生成AIアプリと私は呼んでいます。このいい感じに連携はAgentという機能で実現されています。
具体ソリューション
世の中にどのような生成AIアプリが存在するのでしょうか。
ChatGPTやClaude、Geminiはもちろんですが、検索AIと呼ばれる検索に特化したPerplexityやGenSparkがあったり、マインドマップをAIが生成するMapifyも生成AIアプリに含まれます。
ここで重要になってくるのが、生成AIだけだとできることは限られていますが、様々なツールやサービスを組み合わせてより価値があるサービスを提供することができるということです。
今後は生成AIが詳しいだけではなく、ツールやサービスの目利きや、組み合わせを考える力が求められてくると考えています。
Dify
その後、2024年春あたりからDifyが生成AI界隈で注目されてきます。
Difyは生成AI構築統合Platformで、使う生成AIやツール、サービスを柔軟に組み合わせて開発できる開発環境となっています。これまで生成AIアプリを開発するときはPython等のプログラミング言語でLangChainといったライブラリを活用しながらゴリゴリ作っていたのですが、新しい生成AIやツール、サービスが登場するとその切り替えでソースコードの修正が発生して柔軟性が乏しかったです。一方、Difyはローコードノーコードでノードを使って生成AIアプリを開発でき、生成AIやツール、サービスを設定で簡単に切り替えることができます。
Difyについて詳しく知りたい方は下記記事にまとめていますので、ぜひご覧ください。
🤗MCPの特徴
これまでの生成AIアプリの全体像を踏まえて、MCPを見ていきましょう。
MCPはDifyでできることを一部PC上で実現できる仕組みと言えます。
Difyとの大きな違いは下記3点です。
- PC上で動かす前提
- PC上のデータソースを操作できる
- オープンソースでSDKが提供されておりMCP Serverを開発できる
生成AIをビジネスや日々の業務にどう活かすか考えている方はわかると思いますが、Cloud上で動く生成AIアプリは情報漏洩やセキュリティの観点で不安が残るし、実際現場でPC内で手を動かす作業の効率化に中々紐づかない点悩みだったと思います。
こういったことが、MCPが注目されている理由だと考えています。
3つ目の「オープンソースでSDKが提供されておりMCP Serverを開発できる」もインパクトある話しで、今後世界中の技術者が様々なMCP Serverを開発してより便利になっていくと予想しています。
もちろん、Anthropic以外の会社もだまっていないと思います。MicrosoftにはCopilotがありますし、GoogleにはGeminiがあります。今後同じよう概念の仕組みが登場して、もしかしたらMCPは淘汰されるかもしれません。
ただ、このMCPの考え方自体は今後も応用を利かせて発展していくはずで、今から使いながら仕組みを理解することは将来の自分への投資になると考えています。
💁MCP活用例
実際のMCPを使ってみた事例をいくつか記事にまとめています。
具体的な動きや何ができるかを知りたい方はぜひご覧ください。
また弊社の原さんがシステム開発における活用例の記事を投稿しているので、ぜひご覧ください。
例えば、システム開発においてはMCPを活用してソースコードをどんどん生成して、MCPを使ってデプロイやアプリ公開していく仕組みも登場してきそうです。
その先駆けがReplit Agentです。
こちらについても弊社の原さんが記事を投稿されているので、ぜひご覧ください。
🎯今後の展望
今後、PC上で動く生成AIアプリの進化が進んでいくと予想しています。
特に最近はLocal LLMやSLMの進化が進んでおり、「MCP+PC上で動く生成AI」が登場してPCで完結する日もそう遠くないかもしれません。
これは、企業が懸念している情報漏洩やセキュリティリスクが軽減することを意味します。
今後、生成AIを活用する企業がさらに増えていくでしょう。
また、2024年10月23日にAnthropicからリリースされた「computer use」との連携も予想できます。「computer use」はAIがPC操作をRPAで行うことができる仕組みで、これまでルールベースの業務でしか適用できなかったRPAのスコープが広がり、業務をより自動化できる可能性があります。
「computer use」については、弊社の工藤さんが記事を書いており、実際の動き含めて参考になるのでぜひご覧ください。
🧸さいごに
いかがでしたか。これまでの生成AIアプリの全体像を踏まえてMCPについて解説してきました。今後もこの分野は進化していくので、私を含めてぜひキャッチアップしていきましょう!
さいごに告知ですが、2024年12月12日に名古屋で「Nagoya LLM Night」が開催されます。私も登壇して、今回の記事の内容を詳しく説明しようと考えています。この記事をご覧になった興味を持たれた方はぜひ参加頂けると嬉しく思います。現地およびオンライン参加が可能です。
Discussion