☸️

【LLM Model】【DeepSeek】ローカル+Colabデプロイ

2025/01/29に公開

deepseek github link:
https://github.com/deepseek-ai
Janus-Pro-7B は、DeepSeek が開発したマルチモーダル AI モデルであり、理解と生成の両方で大きな進歩を遂げています。つまり、テキストだけでなく、画像などの他のモダリティからの情報も処理できるということです。

モデル特徴:
オープンソース:
Janus-Pro-7B はオープンソースであるため、研究者や開発者は自由にアクセスして使用し、AI 分野のイノベーションを推進できます。
分離されたビジュアル エンコーディング:
理解タスクと生成タスクのバランスを改善するために、Janus-Pro はビジュアル エンコーディングを独立したパスに分離し、モデルの柔軟性とパフォーマンスを向上させます。
強力なパフォーマンス:
複数のベンチマークにおいて、Janus-Pro は以前の統合モデルよりも優れており、タスク固有のモデルにも匹敵します。

応用シナリオ:
コンテンツ作成: ユーザーが高品質の画像、テキスト、その他のマルチメディア コンテンツを生成するのに役立ちます。
教育: テキストの説明に基づいて画像を生成したり、画像の内容に基づいて質問に答えたりするなど、インタラクティブな学習体験を作成するために使用できます。
カスタマー サービス: ユーザーのマルチモーダル クエリを理解して応答できる、よりスマートなチャットボットを構築するために使用できます。
支援設計: デザイナーがクリエイティブなコンセプトを生成し、それを視覚的なプロトタイプに変換するのに役立ちます。

ローカルへデプロイ
conda create -n myenv python=3.10 -y

git clone https://github.com/deepseek-ai/Janus.git

cd Janus

pip install -e .

pip install webencodings beautifulsoup4 tinycss2

pip install -e .[gradio]

pip install 'pexpect>4.3'

python demo/app_januspro.py

Colabへデプロイ
!git clone https://github.com/deepseek-ai/Janus.git

%cd Janus

!pip install -e .

!pip install -e .[gradio]

!python demo/app.py

Discussion