📖

DeepSeek + Dify を活用したローカルナレッジベース構築

2025/03/13に公開

こんにちは、中国のソフトウェアエンジニア Mengke です。
主に フロントエンド開発に携わっています。

日本が大好きで、2024年に訪れました!✨ 現在、日本語を勉強中ですが、まだ上手ではないので、このブログ記事は AI の助けを借りて翻訳しました。

今回の記事では、DeepSeek + Dify を使ってローカル環境でナレッジベースを構築する方法を紹介します。

私と友達になりたい方は、私の個人ウェブサイト mengke.me で見つけてください。

どうぞよろしくお願いします! 🚀


本記事では、ローカル環境で DeepSeek モデルをデプロイし、Chatbox AI と Dify を使用して完全なナレッジベースアプリを構築する方法を紹介します。

デバイス

使用している PC は MacBook Pro 2021 で、チップは M1 Pro、メモリは 16GB です。

1. Ollama のインストール

Ollama の公式ダウンロードページ: https://ollama.com/download

インストール完了後、以下のコマンドでバージョンを確認できます。

➜  ~ ollama -v
ollama version is 0.5.7
➜  ~

また、http://localhost:11434 を開いて、サービスが正常に起動しているか確認できます。

2. DeepSeek モデルのデプロイ

DeepSeek は以下のような異なるバージョンのモデルを提供しています。

  • 7B:エントリーレベルのハードウェア向け(16GB+)
  • 14B:パフォーマンスとリソース消費のバランス(32GB+)
  • 33B:高性能(64GB+)

ダウンロードとインストール

例として deepseek r1 モデルを使用します。

  1. https://ollama.com/library/deepseek-r1 にアクセスし、デフォルトの 7b モデルを取得します。他のモデルを選択する場合は、検索を使用してください。
  2. 必要なモデルの詳細ページから ollama run deepseek-r1 コマンドをコピーします。
  3. ターミナルで以下のコマンドを実行します。
➜  ~ ollama run deepseek-r1

パフォーマンスのヒント:ハードウェアのスペックが十分であれば、14B 以上のモデルを選択すると、より高い推論精度が得られます。

インストールが成功すると、以下のように表示されます。

➜  ~ ollama run deepseek-r1
pulling manifest
pulling 96c415656d37... 100% ▕██████████████▏ 4.7 GB
pulling 369ca498f347... 100% ▕██████████████▏ 387 B
pulling 6e4c38e1172f... 100% ▕██████████████▏ 1.1 KB
pulling f4d24e9138dd... 100% ▕██████████████▏ 148 B
pulling 40fb844194b2... 100% ▕██████████████▏ 487 B
verifying sha256 digest
writing manifest
success
>>> Send a message (/? for help)

3. 動作確認

4. Dify を使用したナレッジベースの構築

Dify は、多様なドキュメント形式の自動ベクトル化と、充実した対話管理インターフェースを提供する AI アプリ開発プラットフォームです。

1. Dify のデプロイ

git clone https://github.com/langgenius/dify.git
cd dify/docker
cp .env.example .env
docker compose up -d

2. DeepSeek モデルの設定

初回アクセス時に、メールアドレス、ユーザー名、パスワードを設定します。

3. モデルの追加

  1. Dify の右上にあるプロフィールアイコンをクリック ➜ 設定 ➜ モデルプロバイダー ➜ Ollama ➜ モデルを追加。
  2. 設定内容:
    • モデルタイプ: LLM
    • モデル名: deepseek-r1
    • 基本 URL: http://host.docker.internal:11434

: host.docker.internal を使用すると、コンテナ内からホストマシンの Ollama サービスにアクセスできます。

4. ナレッジベースの作成

ナレッジベース ➜ 新規作成 ➜ ドキュメントをアップロード ➜ 処理完了を待機

5. AI ボットとの連携

  1. ボットのページを開く。
  2. ナレッジベースで作成したデータを選択。
  3. 公開。

6. プロンプトの最適化

あなたは厳格かつ専門的な AI アシスタントです。すべての回答はナレッジベースの内容に厳密に基づく必要があります。

- ナレッジベースに回答がある場合は、その情報を正確に提示し、補足や推測を行わないこと。
- ナレッジベースに情報がない場合は、「申し訳ありませんが、該当情報はありません。」と回答すること。
- 回答は明確、簡潔、かつ専門的であること。
- 複数の知識が必要な質問には、ナレッジベースの内容を統合して回答すること。
- 曖昧な質問に対しては、より具体的な情報提供を求めることで、回答の精度を向上させること。

以上のルールを厳守してください。質問に答えてください。

推奨: テーマごとにナレッジベースを分けることで、回答精度を向上させることができます。

5. Chatbox AI の導入

AIとチャットしたい場合は、この手順を実行できます。

公式サイト: https://chatboxai.app/

設定手順

  1. 設定 ➜ モデルプロバイダーを「Ollama」に設定
  2. API ドメイン: http://127.0.0.1:11434
  3. モデル: deepseek-r1:latestÏ

Chatbox AI はインターネット検索にも対応し、推論プロセスの可視化が可能です。

Discussion