🚀
Google ColabでLangChainを使ってGitHubリポジトリを学習させる
🌟 はじめに
おぐまです。
Google Colabを使ってLangChainでGitHubリポジトリの内容を学習し、質問に答えられるシステムを作る方法をご紹介します。
環境構築の心配なく、ブラウザだけで試せるようにしました!😆
👷♂️ Google Colabでの準備
特にありません!
以下からLangchain_GithubLoader.ipynbを開いてREADMEに従い実行してください。
🎨 コードの説明
- 必要なモジュールをインポートします。
- OpenAI APIキーを環境変数から取得します。
- GitHubリポジトリの情報を設定します。
- GitLoaderを使ってリポジトリの内容を読み込みます。
- VectorstoreIndexCreatorを使ってインデックスを作成します。
- RetrievalQAチェーンを作成し、質問を設定して回答を取得します。
🤔 注意点
🎨 実行結果例
コードを実行すると、以下のような出力が得られます。
サンプルコードでは自分のGithubのProfileを読み込んでいます。
インデックスの作成が完了しました。
質問: GithubのProfileにどんなものが設定されていますか?
回答: GitHubのプロフィールには以下の情報が設定されています:
- スキルセクションにはPython、CSS、Dart、JavaScriptが表示されています。
- GitHubの統計情報として、リポジトリの統計、活動時間、使用言語の割合、最も多くコミットした言語などが表示されています。
- GitHubプロフィールの詳細情報が表示されています。
- Spotifyの最近再生されたトラックが表示されています。
🎉 まとめ
このGoogle Colabスクリプトを使用することでGitHubリポジトリの内容を学習し、質問に答えられるシステムを簡単に作成できます。
LangChainとOpenAIの力を借りて、大規模なコードベースやドキュメントの理解を効率化できます。
JustIdeaですがGithubActionと組み合わせて指定したGithubリポジトリのREADMEを自動作成することもできると思います!
参考
Discussion