Metaの大規模言語モデル「LLAMA」モデルのダウンロード方法
はじめに
最近話題となったMetaが公表した大規模言語モデル「LLaMA」
少ないパラメータ数でGPT-3などに匹敵する性能を出すということで、自分の環境でも実行できるか気になりました。
少々ダウンロードが面倒だったので、その方法を紹介します!
方法
1.申請
まず、MetaのLLaMAリポジトリを確認。
ここで、一番手間になるのが、LLaMAのダウンロードのためには、Metaが用意した申請フォームに答えなければいけないという事です。
githubのreadmeの一番上にある、google formから申請できます。
こんな感じのフォームが出てきます。
ここに必要事項を記入していきます。
ここで、Previous related publicationという欄がありますが、自分は"Nothing"と答えても問題なかったので、あまり気にされなくて大丈夫だと思います。
このフォームに答えると、5日後ほどでメールが届きます。
そのメールには、ダウンロード用のURLが記されています。これを後ほど使います。
2.ダウンロード
続いて、ダウンロードするために実行ファイルが必要になるため、llamaのリポジトリをご自分のPCにcloneします。
$ git clone https://github.com/facebookresearch/llama.git
ファイルの中に"download.sh"というものがありますので、こちらの中身を確認します。
すると一番上にURLを入力する欄があるのでそちらにメールで送られてきたURLをコピペします。
また、MODEL_SIZEでダウンロードしたいモデルサイズを指定します。デフォルトは全てのモデルをダウンロードする設定になっていますが、時間がかかる上に200GB程ストレージを食うので注意!
TARGET_FOLDERでモデルのダウンロード先のフォルダを指定します。適当に"model"とかで良いでしょう。
PRESIGNED_URL="送られてきたURL"
MODEL_SIZE="好きなモデルサイズ"
TARGET_FOLDER="モデルのダウンロード先のフォルダ"
後はこのシェルスクリプトを実行します。自分はwindowsユーザーなので、wslでbashコマンドを打って実行しました。
ただ、ここで自分の環境では以下のようなエラーが出てしまいました。
どうやら、コードの改行のエラー?のようなものがあったようなので、以下のように修正コマンドを入れることで解決しました。
$ sed -i 's/\r//' setup.sh
$ bash download.sh
これでダウンロードが始まるはずです。
辛抱強く待つとTARGET_FOLDERの下に7B,13B...などのモデルが格納されているはずです!
以上がLLaMAのダウンロード方法でした。
マシンスペックの高い方は試しにローカルで動かしてみたりして遊んでみてください!
おわりに
申請を待つ必要があったり、ダウンロードが面倒なところを考えると、最近出たFlan-UL2とかの方が楽かもしれませんね...まあ、今回は初の言語モデルですし...Metaの今後に期待ですね。
Discussion