🐨

Appleから発表されたOpenELMを早速触ってみる

2024/04/28に公開

AppleからもオープンソースのLLMが登場

2024年4月24日にAppleからオープンソースの言語モデルがHugging Face上に公開されました。
目的は最先端の言語モデルへのアクセスを提供することで、オープンな研究コミュニティに力を与え、豊かにすることだそうです。

モデルは2億7000万、4億5000万、11億、30億の4つのパラメータのサイズがあるようです。
安全性の保証なしで利用できる反面、ユーザーのプロンプトに応じて、不正確、有害、偏った、または不快な出力を生成する可能性があります。
ですので開発者は徹底的な安全性テストを実施し、特定の要件に合わせた適切なフィルタリング メカニズムを実装することが不可欠とのこと。

強みは何といってもAppleデバイス上(iPhone, Macなど)でモデルを動かすことができること。

https://www.itmedia.co.jp/news/articles/2404/25/news103.html

設定

以下の記事を参考にHugging Faceの登録とアクセストークンを取得。

https://zenn.dev/headwaters/articles/261e90e3696620

どんなものか使ってみる

1. リポジトリをクローン

git clone https://huggingface.co/apple/OpenELM-270M-Instruct

2.パッケージを導入

pip install torch transformers

3. モデルを実行

「あなたの名前は?」と聞いてみます。
python generate_openelm.py --model apple/OpenELM-270M-Instruct --hf_access_token <your access token> --prompt 'hello, what your name?' --generate_kwargs repetition_penalty=1.2


ロードが開始されました。


しかしエラーになりました。
OpenELMはトークナイザーにllama2を使っているのでアクセス申請をする必要があります。


4. llama2の利用申請

以下のサイトにアクセス。

https://huggingface.co/meta-llama/Llama-2-7b-hf

申請をします。


2,30分ほどで承認メールが届きました。


5. 再度実行

数秒待つとレスポンスが返ってきました!


6. 日本語で試してみる

「今日は何月何日ですか?」と聞いてみます。

...回答はしてくれるものの内容は全くの的外れでした。

次回

iPhone上で動かしてみようと思います。

ヘッドウォータース

Discussion