🚀

Google ColabでLangChainを使ってGitHubリポジトリを学習させる

2024/11/27に公開

🌟 はじめに

おぐまです。
Google Colabを使ってLangChainでGitHubリポジトリの内容を学習し、質問に答えられるシステムを作る方法をご紹介します。
環境構築の心配なく、ブラウザだけで試せるようにしました!😆

👷‍♂️ Google Colabでの準備

特にありません!
以下からLangchain_GithubLoader.ipynbを開いてREADMEに従い実行してください。

https://github.com/9mak/Langchain_GithubLoader

🎨 コードの説明

  1. 必要なモジュールをインポートします。
  2. OpenAI APIキーを環境変数から取得します。
  3. GitHubリポジトリの情報を設定します。
  4. GitLoaderを使ってリポジトリの内容を読み込みます。
  5. VectorstoreIndexCreatorを使ってインデックスを作成します。
  6. RetrievalQAチェーンを作成し、質問を設定して回答を取得します。

🤔 注意点

🎨 実行結果例

コードを実行すると、以下のような出力が得られます。
サンプルコードでは自分のGithubのProfileを読み込んでいます。

インデックスの作成が完了しました。
質問: GithubのProfileにどんなものが設定されていますか?
回答: GitHubのプロフィールには以下の情報が設定されています:

- スキルセクションにはPython、CSS、Dart、JavaScriptが表示されています。
- GitHubの統計情報として、リポジトリの統計、活動時間、使用言語の割合、最も多くコミットした言語などが表示されています。
- GitHubプロフィールの詳細情報が表示されています。
- Spotifyの最近再生されたトラックが表示されています。

🎉 まとめ

このGoogle Colabスクリプトを使用することでGitHubリポジトリの内容を学習し、質問に答えられるシステムを簡単に作成できます。
LangChainとOpenAIの力を借りて、大規模なコードベースやドキュメントの理解を効率化できます。

JustIdeaですがGithubActionと組み合わせて指定したGithubリポジトリのREADMEを自動作成することもできると思います!

参考

https://zenn.dev/umi_mori/books/prompt-engineer/viewer/github_repository_langchain_chatgpt

GitHubで編集を提案
株式会社エーピーコミュニケーションズ

Discussion