🛵
MCPのSampling機能を試す

2025/06/23に公開
VS Code
Model Context Protocol
GitHub Copilot
LLM
tech
MCPの仕様書を読んでいたらSamplingという機能があり面白そうだったので試してみました。また最近GitHub CopilotがSampling機能をサポートしたので、クライアントにはGitHub Copilotを使いました。なお、現時点ではClaude DesktopはSamplingに対応していないです。
今回用いるコードは全てこちらで公開しています： https://github.com/mi-wada/mcp-sampling-examples/tree/main/fortune-mcp-server

 SamplingとはSamplingとは、MCPサーバーがクライアントに対してLLMの推論を要求できる機能です。サーバーがクライアントを呼び出すという従来とは逆方向の通信なのでそこは注意が必要です。
Samplingの大雑把なフローは以下の通りです：
MCPサーバーがMCPクライアントにsampling/createMessageリクエストを送信
クライアントがLLMに推論をさせる
クライアントが推論結果をサーバーに返却
詳しい仕様はSamplingのドキュメントを参照してください。

 実装ユーザー名を受け取り占い結果を返すMCPサーバーを実装しました。占い処理自体はMCPサーバーではなく、Sampling機能を使って呼び出し元のLLMに任せています。
通信にはstdio transportを利用しているため、MCPクライアントにstdoutでSamplingリクエストを送り、推論結果はstdinで受け取ります。@modelcontextprotocol/sdkを見る限り、Sampling用のAPIはまだないようなので愚直に実装しています。
処理の流れをまとめると、stdoutでMCPクライアントにリクエスト送信、MCPクライアントがLLMに推論を依頼、stdinで推論結果を受信、といった流れです。stdoutとstdinの役割が逆転して見えるので少しややこしいですが、詳細はコードを参照してください。
import { McpServer } from "@modelcontextprotocol/sdk/server/mcp.js";
import { StdioServerTransport } from "@modelcontextprotocol/sdk/server/stdio.js";
import { z } from "zod";

const server = new McpServer({
  name: "fortune-mcp-server",
  version: "1.0.0",
});

server.registerTool(
  "fortune",
  {
    title: "Fortune telling",
    description: "Tell fortune based on given name",
    inputSchema: {
      name: z.string(),
    },
  },
  async ({ name }: { name: string }) => {
    // stdoutでSamplingのリクエストをMCPクライアントに送る。
    const samplingRequest = {
      jsonrpc: "2.0",
      id: 1,
      method: "sampling/createMessage",
      params: {
        messages: [
          {
            role: "user",
            content: {
              type: "text",
              text: `あなたは占い師です。${name} という名前の人の今日の運勢を占ってください。以下の要素を含めて、楽しく魅力的な占い結果を日本語で作成してください：

1. 総合運（5段階評価）
2. 恋愛運
3. 仕事運
4. 今日のアドバイス

名前の文字や響き、生まれ月から連想して、それっぽい占い結果を作成してください。
`,
            },
          },
        ],
        maxTokens: 1000,
      },
    };
    process.stdout.write(`${JSON.stringify(samplingRequest)}\n`);

    // process.stdin にSamplingのレスポンスが入るので、それが届くまで待つ。
    const response = await new Promise<{
      result: { content: { text: string } };
    }>((resolve) => {
      const onData = (chunk: Buffer) => {
        try {
          const parsed = JSON.parse(chunk.toString());
          process.stdin.removeListener("data", onData);
          resolve(parsed);
        } catch {
          // 無視
        }
      };

      process.stdin.on("data", onData);
    });

    return {
      content: [
        {
          type: "text",
          text: response.result.content.text || "No response received",
        },
      ],
    };
  },
);

const transport = new StdioServerTransport();
await server.connect(transport);

 実際に試してみるまずはVS Codeのsettings.jsonに以下の設定を追加します：
{
  // ...
  "mcp": {
    // ...
    "fortune": {
      "command": "path to npm",
      "args": ["run", "start"],
      "cwd": "/path/to/your/fortune-mcp-server"
    }
    // ...
  }
  // ...
}
そしてChatから以下のように実行できます。Outputを見ると占い結果が含まれているため、Samplingが成功していることがわかります。
初回実行時には、Sampling機能の使用許可を求める確認ダイアログが表示されます：

 おわりにMCPのSampling機能を使って、MCPサーバーからMCPクライアントに対してLLMの推論を要求することができました。なんか色々応用できそうですね。
GitHubで編集を提案
Samplingとは

実装

実際に試してみる

おわりに

Discussion