🍣

Metaの大規模言語モデル「LLAMA」モデルのダウンロード方法

2023/03/07に公開

はじめに

最近話題となったMetaが公表した大規模言語モデル「LLaMA」

少ないパラメータ数でGPT-3などに匹敵する性能を出すということで、自分の環境でも実行できるか気になりました。

少々ダウンロードが面倒だったので、その方法を紹介します!

方法

1.申請

まず、MetaのLLaMAリポジトリを確認。

https://github.com/facebookresearch/llama

ここで、一番手間になるのが、LLaMAのダウンロードのためには、Metaが用意した申請フォームに答えなければいけないという事です。

githubのreadmeの一番上にある、google formから申請できます。

こんな感じのフォームが出てきます。

ここに必要事項を記入していきます。

ここで、Previous related publicationという欄がありますが、自分は"Nothing"と答えても問題なかったので、あまり気にされなくて大丈夫だと思います。

このフォームに答えると、5日後ほどでメールが届きます。

そのメールには、ダウンロード用のURLが記されています。これを後ほど使います。

2.ダウンロード

続いて、ダウンロードするために実行ファイルが必要になるため、llamaのリポジトリをご自分のPCにcloneします。

$ git clone https://github.com/facebookresearch/llama.git

ファイルの中に"download.sh"というものがありますので、こちらの中身を確認します。

すると一番上にURLを入力する欄があるのでそちらにメールで送られてきたURLをコピペします。

また、MODEL_SIZEでダウンロードしたいモデルサイズを指定します。デフォルトは全てのモデルをダウンロードする設定になっていますが、時間がかかる上に200GB程ストレージを食うので注意!

TARGET_FOLDERでモデルのダウンロード先のフォルダを指定します。適当に"model"とかで良いでしょう。

PRESIGNED_URL="送られてきたURL" 
MODEL_SIZE="好きなモデルサイズ" 
TARGET_FOLDER="モデルのダウンロード先のフォルダ" 

後はこのシェルスクリプトを実行します。自分はwindowsユーザーなので、wslでbashコマンドを打って実行しました。

ただ、ここで自分の環境では以下のようなエラーが出てしまいました。

どうやら、コードの改行のエラー?のようなものがあったようなので、以下のように修正コマンドを入れることで解決しました。

$ sed -i 's/\r//' setup.sh
$ bash download.sh

これでダウンロードが始まるはずです。

辛抱強く待つとTARGET_FOLDERの下に7B,13B...などのモデルが格納されているはずです!

以上がLLaMAのダウンロード方法でした。

マシンスペックの高い方は試しにローカルで動かしてみたりして遊んでみてください!

おわりに

申請を待つ必要があったり、ダウンロードが面倒なところを考えると、最近出たFlan-UL2とかの方が楽かもしれませんね...まあ、今回は初の言語モデルですし...Metaの今後に期待ですね。

Discussion