📖

Llama-3-ELYZA-JP-8Bを動かす 

2024/07/01に公開

Llama-3-ELYZA-JP-8Bとは?

ELYZAが提供する大規模言語モデル「ELYZA LLM for JP」シリーズの最新モデルとして、Meta社の「Llama 3」をベースとした700億パラメータの「Llama-3-ELYZA-JP-70B」と80億パラメータの「Llama-3-ELYZA-JP-8B」を開発し、性能を公開しました。

https://prtimes.jp/main/html/rd/p/000000046.000047565.html

前提

  • Text generation web UIを起動できる状態であること

https://zenn.dev/headwaters/articles/3c2a9310004a94

手順

  1. Text generation web UIを立ち上げる

  2. Model タブをクリックする

  3. 「elyza/Llama-3-ELYZA-JP-8B-GGUF」と入力し、Get file listをクリックする

  4. Download をクリックする

  5. Downloadされたことを確認する

  6. Relaod をクリックし、Modelで「elyza/Llama-3-ELYZA-JP-8B-GGUF」を選択する。

  7. Save Settings をクリックする

  8. 会話してみる。日本語に違和感なし!

  9. おにぎりの作り方を聞いてみる

  10. プログラミングの質問をする

  11. 実行してみる

def is_prime(n):
    if n < 2:
        return False
    for i in range(2, int(n ** 0.5) + 1):
        if n % i == 0:
            return False
    return True

primes = []
i = 2
while len(primes) < 100:
    if is_prime(i):
        primes.append(i)
    i += 1

print(primes)

多分あってると思う

まとめ

Llama-3-ELYZA-JP-8Bを動かしてみた。
日本語の精度が高くすげーと思いました。
パラーメータ数も少ないので、エッジデバイスで動かせそうだなと思いました。

ヘッドウォータース

Discussion