🤔

結局MCPって何なの?

に公開

DXER株式会社のエンジニアのわたるです

今回は最近良く聞くようになったMCPについて噛み砕いて解説したいと思います!
私自身はニュースでよくMCPって単語を聞いていて、プロトコルなのは知っているけどふわっとしててあんまり良くわからないなって状態だったので結局何ができるのかよくわかってなかったです
今回はMCPについて実際に動かしたり勉強したりする機会があったので、結局MCPってなんなの?MCPで何ができるの?みたいなところを中心に書いていきます
一般的な定義はすでに多く語られていますので個人的にとても大事だなと思ったことをピックアップして書こうと思います

MCPとは

ChatGPT、Gemini、Claudeなど、近年話題となっている生成系AIやLLMは、とても便利で万能に見える一方、外部へ直接アクションを起こせないという弱点があります
文章構造の理解やパターンの抽出だったり、要約、コーディングなどは非常に得意で私も日常的にお世話になっておりますが、カレンダーへの予定の登録やメールの返信、新幹線の予約などはできません
例えるなら、LLMは「頭脳だけの存在」であって、手足がないのです
実際にChatGPTに「今日の予定を教えて」と聞いても答えてくれません

そこでLLMに手足を提供してできることを増やしてあげるための仕組みがMCPになります
例えば、複数のMCPによってLLMはGoogleカレンダーの予定を参照、登録できるようになったりGoogle Mapから行き先の最短経路を取得できるようになったりします

MCPの仕組み

具体的にLLMはMCPを使ってどのように外部に影響を及ぼせるのかについて説明します
MCPはあくまでプロトコルなので、通信方式はこのようにしましょうといったルールに過ぎません
外部に影響する役割を担っているのは実際にはMCPサーバーです
MCPサーバーとはLLMが使用するツールを詰め込んだ箱みたいなものです
LLMはMCPを介してMCPサーバーと通信します
LLMがMCPサーバーと最初に接続したタイミングでLLMはMCPサーバーになんのツールがあるのかを聞きます
MCPは、私はGoogleカレンダーの予定を取得したり、カレンダーの予定を更新することができます!と自己紹介を行います
このプロセスを踏むことで、LLMに対して今日の予定を教えてと指示を出すとMCPサーバーのツールを使ってGoogleカレンダーの予定を取得するようになります

以下はイメージです(正確に言うとMCPとは異なるのですがややこしくなるので説明しません)

MCPで何が変わるのか

2025年はAIエージェント元年になると言われていますが、MCPが大きな役割を果たすと思われます
複数のMCPサーバーを駆使したAIエージェントが誕生すれば、様々なことが効率化できそうです

友達と映画を行くときも、LINE上でおすすめの映画をChatGPTに聞いて、見たい映画のチケットを予約してもらい、各々のGoogleカレンダーに自動的に予定が登録される

会社においても社内のスケジュールツールやプロジェクト管理ツールと連携し、SlackやTeams経由で「来週のミーティング予定を調整しておいて」とLLMに伝えるだけで日程調整が完了するとか軽く考えるだけでもいろいろできるようになりそうでワクワクしますね!

MCPが抱える課題

もちろん、MCPはあくまでプロトコルであり万能ではありません
ChatGPTがハルシネーションを起こすのと同じように、LLMが正しい意図で正しいツールを使うとは限りません
誤った推論による誤操作のリスクを下げるための確認プロセスやステップ実行に関する設計が不可欠です

こうした課題があるからこそ、各所でMCPの運用ガイドラインや開発フレームワークが今後続々と出てくるはずです
いまこのタイミングで情報をキャッチアップしておくのは非常に有意義だと思います

まとめ

2025年が「AIエージェント元年」といわれるのは、こうしたプロトコルの整備や、実際のサービス実装の進化が急速に進むと見られているからでしょう
もしAIエージェントによって人間が手を動かす作業が大幅に削減されるとしたら、その余った時間でやりたいことを実現できたり、新たなサービス開発に取り組めたりするはずです
私もMCPを駆使してもっと作業効率化できないか模索していこうと思います

Discussion