✌️

Claude Hands: Windows(amd64)上のPodmanを使って動かす!

https://github.com/r488it/claude_hands

はじめに

2025年4月19日に執筆したClaude Handsの記事ですが、Dockerが使えない環境やarm64ではなくamd64だったりして、そのまま利用できないケースがありました。これに対して、昨日(2025年5月1日)にPodmanやamd64で動作する版をプルリクエストさせて頂きマージされました。ので、Windows(amd64)でPodmanを使ってClaude Handsを動かす手順を記事にさせて頂きました。
https://zenn.dev/acntechjp/articles/265d603b983cd8
Claude Handsを取り巻く環境としては、Anthropic社からAdvanced Research(ChatGPTでいうDeep Research)が発表されてClaude Handsを使わなくてもエージェンティックな調査とレポートが可能になりつつあります。一方で、Advanced ResearchはProプランにはまだ展開されていないのと、まだまだ安定していなさそうということもあり、Claude Handsの出番はあるかなと考えています。
ぜひ、この機会にClaude Handsを通してエージェンティックな世界観を体験して頂きたいのと、AI Agentを活用した業務改革や業務効率化を考えるキッカケにして頂けると幸いです。

Gitをインストール

下記からダウンロードしてインストールしましょう。インストールすると、WindowsのPowerShellからコマンド「git」が使えるようになるはずです。
https://git-scm.com/downloads

git --version


「git --version」が実行されることでgitがインストールされていることを確認

Podmanをインストール

Podman公式ページからPodmanをダウンロードします。CLI操作中心なので、「Podman CLI for Windows」をダウンロードで良いと思います。
https://podman.io/

ダウンロードしたインストーラを起動します。

今回は、WSLv2を使うやり方をとるので、「Windows Linux Subsystems (WSLv2)」を選択した状態で「Install」ボタンを押下します。

インストールが進んできます。

数分で完了します。「Close」ボタンを押下します。

PowerShellからPodmanがインストールされているか確認しましょう。下記のようにバージョン情報が表示されればOKです。

podman --version

Podmanの初期設定

Podmanの初期化をします。

podman machine list
podman machine init


Podmanの仮想環境を起動します。

podman machine start


起動したPodmanの仮想環境を確認します。

podman machine list

Claude Handsをダウンロード

下記GitHubのClaud Handsをダウンロードします。
https://github.com/r488it/claude_hands
方法としてはGitコマンドを使います。
Gitコマンドを使う前に任意のフォルダを作っておきましょう。(この記事の例だと、C:\temp\claude_hands_test)

cd C:\temp\claude_hands_test
git clone https://github.com/r488it/claude_hands.git

Claude Handsを設定

ダウンロードしたフォルダを開くと下記キャプチャのようになっています。
ファイル「.env.sample」をコピーして「.env」を作りましょう。

「.env」を作った結果です。

「.env」の内容ですが、tavilyというWebスクレイピングしてくれるサービスのAPIキーと、Claude Handsが出力するファイル(ToDoや中間成果物含む)の格納先を指定しています。

tavilyのAPIキーは下記から取得してください。
https://tavily.com/

Podmanコンテナを構築して起動

Podman composeを使ってPodmanコンテナを構築して起動します

podman compose --file docker-compose_amd64.yml up -d

Claudeを設定

Claudeを起動して、「claude_desktop_config.json」を開きます。

下記内容に書き換えます。(書き換える前の状態で一度バックアップをとっておいたほうが良いですね。)

claude_desktop_config.json
{
  "mcpServers": {
    "claude_code_podman": {
      "command": "podman",
      "args": [
        "attach",
        "claude_hands-claudecode-1"
      ]
    },
    "tavily-mcp": {
      "command": "podman",
      "args": [
        "attach",
        "claude_hands-tavily-1"
      ]
    },
    "playwright": {
      "command": "npx",
      "args": [
        "@playwright/mcp@latest"
      ]
    }
  }
}


Claudeのプロセスを停止します。Claudeのウインドウを閉じるだけでは停止にならず、下記gif動画のようにタスクバーから操作が必要です。

そして、Claudeを再度起動します。下記のようにMCP Serverが3つ列挙されていればOKです。

  • claude_code_podman
  • tavily-mcp
  • plyawright

Claudeのプロジェクトを作成

Claudeで新しいプロジェクトを作成して、プロジェクトナレッジにClaude Hands用のプロンプトを設定します。

設定するプロンプトは下記です。
やりたいことに合わせてカスタマイズしてください!

プロジェクトナレッジに設定するプロンプト
# 作業ディレクトリ
・あなたの作業ルートディレクトリは:/workspace/manus   
・作業時依頼内容によく合うワード2つ程度のディレクトリ名を考えて   
・”workspace/manus/考えたディレクトリ名”で作業すること    
・同じフォルダがある場合は別の名前を考えること

# デプロイルール
・ユーザがアプリやWEBサイトの開発を依頼した場合、デプロイをするころ   
・あなたが使えるデプロイ環境の情報:ip='0.0.0.0' port='9999'    
・デプロイ完了後ユーザにデプロイしたURLを示すこと   
・例)http://0.0.0.0:9999/xxxx   

# タスク管理
・ユーザから依頼された際、ユーザは何を求めているのかよく考え、これからやるべきことをtodo.mdにマークダウン形式に書き起こす   
・タスクとサブタスクの数は依頼内容によって判断してください   

# 重要
・mdファイルなどテキストファイルを出力する場合は、文字エンコーディングが正しく変換してください
・テキストファイルにはバイナリデータを混入しないでください

~~~
例
# 〇〇タスク

## タスク名1
- [ ] サブタスク1
- [ ] サブタスク2
- [ ] サブタスク3

・そのタスクリストに沿ってタスクを実行してください、終わったタスクは
- [x] タスク のようにtodo.mdを更新すること
~~~

・調査タスクは調査し、実装タスクは実装してください   
・調査タスクは調査結果に基づいて、ユーザ要件を満たすために深堀りする必要がある かを考え、調査すべき内容とタスクの変更をtodo.mdに更新すること   
・更新されたタスクに基づいて続けて実施してください

# 開発環境
・Ubuntu 22.04.5 LTS   
・node -v : v20.19.0   
・uv -V : uv 0.6.10   
・python3 -V : Python 3.12.8   
・pythonで開発する場合はuvで仮想環境を作ること   


# 情報検索手段
・あなたはブラウザとtavily両方使えます、ユーザの指示がなければtavilyでアクセスできないページはブラウザで情報を取得して

つかってみよう!

それでは、実際に使ってみましょう!下記プロンプトを入力してClaude Handsに調査・レポートしてもらいました!

プロンプト
NotebookLMで音声概要が日本語でも利用できるようになりました。このことに関するSNS上での利用者の反応を調査してレポートしてください。

実際に動いている様子は下記YouTubeをご覧ください!
https://youtu.be/MZouJfUriqA
出力されたレポートは下記となります!

Claude Handsのレポート
# NotebookLMの日本語音声概要機能に関するSNS調査レポート

## 1. はじめに

本レポートでは、Googleが提供する「NotebookLM」の「音声概要」機能が日本語に対応したことに関するSNS上での反応を調査した結果をまとめます。機能の概要、リリース情報、ユーザーの反応、および今後の展望について分析します。

## 2. NotebookLMと音声概要機能の概要

### 2.1 NotebookLMとは

NotebookLMは、Googleが提供するGeminiベースのAIを搭載した調査アシスタントアプリです。ユーザーがアップロードした資料(PDF、テキスト、Webサイト、動画、音声など)に対して、大規模言語モデル(LLM)を活用して回答や要約を生成するツールです。個人やチーム専用のAIデータベースを作成できる「AIリサーチアシスタント」として機能します。

2024年に200以上の国と地域で提供が開始され、日本でも利用可能になっています。

### 2.2 音声概要機能とは

音声概要(Audio Overview)機能は、NotebookLMにアップロードした資料の内容をAIが分析し、ポッドキャストのような会話形式で音声要約を自動生成する機能です。この機能の主な特徴は以下の通りです:

- 2人のAIホスト(男性・女性)による対話形式で概要を説明
- 単なる読み上げではなく、自然な会話のようなインタラクション
- MP3形式でダウンロード可能
- カスタマイズ機能で要約の内容や方向性を調整可能

### 2.3 日本語対応について

- **リリース時期**: 2025年4月30日に日本語を含む50以上の言語に対応したことが発表
- **技術基盤**: Gemini 2.5 Proのネイティブ音声処理能力とマルチモーダルAI技術を活用
- **言語設定**: ユーザーのGoogleアカウントの言語設定に応じて生成されるが、NotebookLMの設定から「出力言語」を自由に変更可能

## 3. SNS上での日本語ユーザーの反応分析

### 3.1 肯定的な反応

日本語ユーザーからの反応は全体的に非常に肯定的で、特に以下の点が高く評価されています:

1. **自然な日本語音声の品質**
   - 「口語の日本語に特徴的な『あの』や『えっと』などのフィラーを交えながら、ネイティブの日本語に非常に近い口調で話されているので、ちょっと聞いたくらいだとAI製とは分からない」(DevelopersIO)
   - 「対話形式で、男女2人が語り合う感じで解説してくれたので、わかりやすかった」(Zenn)
   - 「カタコトの日本語ではなく、流暢な日本語として話してくれます」(DevelopersIO)

2. **情報収集方法の革新**
   - 「新規情報のキャッチアップ方法が大きく変わるかもしれない」(DevelopersIO)
   - 「移動中に情報収集」「ながら聴き」として高く評価
   - 「英語の資料でも日本語で音声概要が聞ける点」が言語の壁を低くしていると評価

3. **使い勝手のよさ**
   - 「想像以上に高品質で実用的な機能」(Zenn)
   - 「これは使わない手はない!」という表現が複数見られる
   - 操作性の良さとスムーズな生成プロセスを評価

### 3.2 改善要望・機能追加への期待

いくつかの改善点や今後の機能追加への期待も見られました:

1. **コンテンツの長さ**
   - 「より長時間のコンテンツが可能になること」への期待
   - 現在の音声概要は比較的短い傾向があるという指摘

2. **カスタマイズ機能の拡充**
   - 「より多様なカスタマイズが可能になること」への期待
   - 話者のキャラクターや話し方のバリエーション増加への期待

3. **その他の期待**
   - インタラクティブモードの日本語対応(現在は英語のみ)
   - 他のGoogleサービスとの連携の拡大

### 3.3 ユースケースと活用シーン

ユーザーから挙げられている主な活用シーンは以下の通りです:

1. **学習・研究支援**
   - 論文や専門書の要約
   - 英語文献の日本語での理解
   - 教材作成と学習者向けの資料提供

2. **ビジネス活用**
   - 会議資料や議事録の要約
   - 営業資料の音声概要による顧客情報収集
   - 社内FAQを要約したAIチャットボット作成

3. **情報収集の効率化**
   - YouTube動画の要約
   - 移動時間などの「スキマ時間」での情報インプット
   - 複数の情報源を一つの音声にまとめることによる効率化

## 4. テクノロジーとユーザー体験

### 4.1 技術的側面

NotebookLMの音声概要機能は、Gemini 2.5 Proのネイティブ音声処理能力を活用しています。一部のユーザーによると、GoogleのResearchチームが開発したSoundStormというAIモデルを使用している可能性があるとの情報もあります。SoundStormは「スクリプトと2つの異なる声の短い音声サンプルを取得し、それを魅力的な完全な音声会話に変換する」技術だとされています。

高品質な音声生成と自然な会話表現が技術的に高く評価されています。

### 4.2 ユーザー体験

音声概要機能のユーザー体験に関する主なフィードバックとしては:

- 生成に数分かかるが、その間に他の作業ができる
- 再生速度の変更やダウンロードが可能で便利
- ポッドキャスト形式が情報の理解を助ける
- 「聞く」ことによる新しい情報取得体験の提供

## 5. 総括と今後の展望

### 5.1 総括

NotebookLMの日本語音声概要機能は、日本のユーザーから非常に好意的に受け入れられています。特に自然な日本語での対話形式の音声生成と、情報収集・学習体験の革新性が高く評価されています。

技術の進化により、AI音声は従来の機械的な読み上げから大きく進化し、よりヒューマンライクで魅力的な体験を提供するようになっています。NotebookLMの音声概要機能は、この進化を象徴する機能として受け止められています。

### 5.2 今後の展望

ユーザーからは以下のような今後の発展への期待が寄せられています:

1. **コンテンツの拡充**
   - より長時間の音声概要
   - より幅広いコンテンツ形式への対応

2. **パーソナライゼーションの強化**
   - より多様な声やキャラクターの選択
   - ユーザー好みのスタイルへのカスタマイズ

3. **他サービスとの連携**
   - Googleの他サービスとの統合
   - サードパーティアプリとの連携可能性

4. **ビジネス活用の拡大**
   - 企業での情報共有ツールとしての活用
   - 教育機関での学習支援ツールとしての展開

## 6. 結論

NotebookLMの日本語音声概要機能は、AI技術の進化とユーザー体験の革新を体現する機能として、日本のユーザーから高い評価を得ています。情報収集や学習の方法に新しい選択肢を提供し、「聴く」という体験を通じて知識獲得の新たな可能性を開いています。

今後のさらなる機能拡充と品質向上が期待される中、NotebookLMの音声概要機能は、AIによる知識アクセスの新たな形として、より多くのユーザーに活用されていくことが予想されます。

おわりに

いかがでしたか。ぜひ、この機会にClaude Handsを活用してみてください!そしてAI Agentを活用した業務改革や業務効率化を考えるキッカケにしていただけると嬉しく思います!
Claude Handsを開発されたGoさんには本当に感謝しています。
GoさんのZennアカウント
GoさんのGitHubアカウント
GoさんのXアカウント

Accenture Japan (有志)

Discussion