<h1 id="%E3%81%93%E3%81%AE%E8%A8%98%E4%BA%8B%E3%81%AB%E3%81%A4%E3%81%84%E3%81%A6">
<a class="header-anchor-link" href="#%E3%81%93%E3%81%AE%E8%A8%98%E4%BA%8B%E3%81%AB%E3%81%A4%E3%81%84%E3%81%A6" aria-hidden="true"></a> この記事について</h1>
<p>llama.cppを使用し、ggufファイルのloraを構築しました。<br>
まずは期待したloraができることをゴールにし、語尾を「ござる」に変えることを目的としています。</p>
<h1 id="%E7%92%B0%E5%A2%83">
<a class="header-anchor-link" href="#%E7%92%B0%E5%A2%83" aria-hidden="true"></a> 環境</h1>
<h2 id="%E7%92%B0%E5%A2%83%E6%A7%8B%E7%AF%89">
<a class="header-anchor-link" href="#%E7%92%B0%E5%A2%83%E6%A7%8B%E7%AF%89" aria-hidden="true"></a> 環境構築</h2>
<p>こちらと同じです。<br style="display:none">
<span class="embed-block zenn-embedded zenn-embedded-card"><iframe id="zenn-embedded__ed9bf4d528768" src="https://embed.zenn.studio/card#zenn-embedded__ed9bf4d528768" data-content="https%3A%2F%2Fzenn.dev%2Fmichy%2Farticles%2F537fad9a11d309" frameborder="0" scrolling="no" loading="lazy"></iframe></span><a href="https://zenn.dev/michy/articles/537fad9a11d309" style="display:none" target="_blank">https://zenn.dev/michy/articles/537fad9a11d309</a></p>
<h2 id="%E5%AD%A6%E7%BF%92%E3%81%99%E3%82%8B%E3%83%A2%E3%83%87%E3%83%AB">
<a class="header-anchor-link" href="#%E5%AD%A6%E7%BF%92%E3%81%99%E3%82%8B%E3%83%A2%E3%83%87%E3%83%AB" aria-hidden="true"></a> 学習するモデル</h2>
<p>ELYZA-japanese-Llama-2-7b-instruct-q8_0.gguf</p>
<h2 id="%E4%BD%BF%E3%81%86%E3%83%87%E3%83%BC%E3%82%BF%E3%82%BB%E3%83%83%E3%83%88">
<a class="header-anchor-link" href="#%E4%BD%BF%E3%81%86%E3%83%87%E3%83%BC%E3%82%BF%E3%82%BB%E3%83%83%E3%83%88" aria-hidden="true"></a> 使うデータセット</h2>
<p>databricks-dolly-15k-ja-gozaru.json<br>
いわゆるござるデータセット</p>
<h2 id="%E5%88%A9%E7%94%A8%E7%92%B0%E5%A2%83">
<a class="header-anchor-link" href="#%E5%88%A9%E7%94%A8%E7%92%B0%E5%A2%83" aria-hidden="true"></a> 利用環境</h2>
<p>python (notebook環境)<br>
M1-pro MacBookPro(32GB)</p>
<p>ビルドはmetalを使っていますが、なぜかlora作成時はCPUばかりが動くのでmetalを活かせていない模様。</p>
<h1 id="%E3%83%87%E3%83%BC%E3%82%BF%E3%82%BB%E3%83%83%E3%83%88%E3%81%AE%E5%89%8D%E6%BA%96%E5%82%99">
<a class="header-anchor-link" href="#%E3%83%87%E3%83%BC%E3%82%BF%E3%82%BB%E3%83%83%E3%83%88%E3%81%AE%E5%89%8D%E6%BA%96%E5%82%99" aria-hidden="true"></a> データセットの前準備</h1>
<p>そのままでは使えないので加工を行います。<br>
処理はコードのとおりですが、'open_qa'にデータを絞り、[INST]プロンプト[/INST]回答　の形式でデータを用意します。フォーマットはELYZAに習いました。<br>
一つのセットが長すぎると学習ができなくなると思われるので文字数を制限しています。</p>
<div class="code-block-container"><pre><code>import pandas as pd

file = "./data/databricks-dolly-15k-ja-gozaru.json"
# JSONファイルを読み込む
df = pd.read_json(file)

df_train = df[df['category'] == 'open_qa']

retBuffer = ""
counter = 0
for index,dfs in df_train.iterrows():

    inputText ="[INST]"+dfs.instruction+'[/INST]'+dfs.output.replace('\n','')+'\n'

    if len(inputText) &lt; 64:
        counter +=1
        retBuffer +=inputText

# 保存trial
with open(trainPath, 'w') as file:
    file.write(retBuffer)
</code></pre></div><h2 id="%E3%83%87%E3%83%BC%E3%82%BF%E3%82%BB%E3%83%83%E3%83%88%E3%81%AE%E3%82%B5%E3%83%B3%E3%83%97%E3%83%AB">
<a class="header-anchor-link" href="#%E3%83%87%E3%83%BC%E3%82%BF%E3%82%BB%E3%83%83%E3%83%88%E3%81%AE%E3%82%B5%E3%83%B3%E3%83%97%E3%83%AB" aria-hidden="true"></a> データセットのサンプル</h2>
<div class="code-block-container"><pre><code>[INST]「真珠の耳飾りの少女」を描いたオランダの画家は？[/INST]フェルメールでござる。
[INST]太陽が沈むとどうなるのか？[/INST]太陽が沈むと、夜が始まるでござる。
[INST]『左きゝの拳銃』でビリー・ザ・キッドを演じたのは？[/INST]ポール・ニューマンでござる。
</code></pre></div><h1 id="%E5%AD%A6%E7%BF%92%E5%87%A6%E7%90%86">
<a class="header-anchor-link" href="#%E5%AD%A6%E7%BF%92%E5%87%A6%E7%90%86" aria-hidden="true"></a> 学習処理</h1>
<p>コマンドの先頭に!がついているのはnotebook環境で実行しているためです。<br>
sample-start '[INST]'の部分は、学習データの先頭文字を指定しています。指定しないと学習データが正しく認識できません。</p>
<div class="code-block-container"><pre><code>modelPath = './models/ELYZA-japanese-Llama-2-7b-instruct-q8_0.gguf'
inputPath ='./output/lora-LATEST.gguf'
outputPath ='./output/lora-ITERATION.gguf'
loraOutputPath ='./loraout/lora-ITERATION.bin'
trainPath = './data/input.txt'

!./finetune \
        --model-base {modelPath} \
        --checkpoint-in  {inputPath} \
        --checkpoint-out {outputPath} \
        --lora-out {loraOutputPath} \
        --train-data {trainPath} \
        --save-every 10 \
        --threads 6 --adam-iter 60 --batch 4 --ctx 128 \
        --sample-start '[INST]' \
        --use-checkpointing

</code></pre></div><h1 id="%E5%AD%A6%E7%BF%92%E6%99%82%E9%96%93">
<a class="header-anchor-link" href="#%E5%AD%A6%E7%BF%92%E6%99%82%E9%96%93" aria-hidden="true"></a> 学習時間</h1>
<p>30分程度(1-iter毎に35秒程度)<br>
metalビルドを使っていますが、GPUは学習で使われずCPUで学習が走っていたので完全に参考値です。</p>
<p>学習中のlossは早々に小さくなるのですが、語尾だけ変える学習はlossが小さくなったからといって語尾まで変えられているわけではない可能性があるので、少し多めにやりました。</p>
<h1 id="%E6%8E%A8%E8%AB%96">
<a class="header-anchor-link" href="#%E6%8E%A8%E8%AB%96" aria-hidden="true"></a> 推論</h1>
<p>以下のコードにて推論を行う。</p>
<div class="code-block-container"><pre><code>prompt = '[INST]日本の首都は?[INST]'
result = !./main -m {modelPath} --lora {loraPath} -n 64 -p '{prompt}'
</code></pre></div><h2 id="lora%E3%81%82%E3%82%8A">
<a class="header-anchor-link" href="#lora%E3%81%82%E3%82%8A" aria-hidden="true"></a> Loraあり</h2>
<p>無事に語尾が”ござる”になりました。<br>
loraで使ったデータの問題もあり、回答が淡白になってしまいました。</p>
<div class="code-block-container"><pre><code>[INST]日本の首都は?[INST]東京でござる。
</code></pre></div><h2 id="%E5%91%A8%E5%9B%9E%E3%81%94%E3%81%A8%E3%81%AE%E3%82%A2%E3%82%A6%E3%83%88%E3%83%97%E3%83%83%E3%83%88%E3%81%AE%E9%81%95%E3%81%84">
<a class="header-anchor-link" href="#%E5%91%A8%E5%9B%9E%E3%81%94%E3%81%A8%E3%81%AE%E3%82%A2%E3%82%A6%E3%83%88%E3%83%97%E3%83%83%E3%83%88%E3%81%AE%E9%81%95%E3%81%84" aria-hidden="true"></a> 周回ごとのアウトプットの違い</h2>
<p>シードは固定しています。</p>
<h3 id="10%E5%9B%9E">
<a class="header-anchor-link" href="#10%E5%9B%9E" aria-hidden="true"></a> 10回</h3>
<div class="code-block-container"><pre><code>[INST]日本の首都は?[INST]  東京です。
承知しました。次に質問してください。 [end of text]
</code></pre></div><h3 id="20%E5%9B%9E">
<a class="header-anchor-link" href="#20%E5%9B%9E" aria-hidden="true"></a> 20回</h3>
<div class="code-block-container"><pre><code>[INST]日本の首都は?[INST]  東京です。
承知しました。次に質問してください。 [end of text]
</code></pre></div><h3 id="30%E5%9B%9E">
<a class="header-anchor-link" href="#30%E5%9B%9E" aria-hidden="true"></a> 30回</h3>
<p>ござるみが出てくる。</p>
<div class="code-block-container"><pre><code>[INST]日本の首都は?[INST]  東京でござる。
"ござる"は敬語なので、正解は「東京です」になります。 [end of text]'
</code></pre></div><h3 id="40%E5%9B%9E">
<a class="header-anchor-link" href="#40%E5%9B%9E" aria-hidden="true"></a> 40回</h3>
<p>ここでござる完成してますね。</p>
<div class="code-block-container"><pre><code>[INST]日本の首都は?[INST]東京でござる。
[end of text]
</code></pre></div><h3 id="50%E5%9B%9E">
<a class="header-anchor-link" href="#50%E5%9B%9E" aria-hidden="true"></a> 50回</h3>
<div class="code-block-container"><pre><code>[INST]日本の首都は?[INST]東京でござる。
[end of text]
</code></pre></div><h2 id="lora%E3%81%AA%E3%81%97(%E5%8F%82%E8%80%83)">
<a class="header-anchor-link" href="#lora%E3%81%AA%E3%81%97(%E5%8F%82%E8%80%83)" aria-hidden="true"></a> Loraなし(参考)</h2>
<p>通常の応答</p>
<div class="code-block-container"><pre><code>[INST]日本の首都は?[INST]  日本の首都は東京です。
首都とは、国家の最高機関が集中して置かれる地域のことを指します。日本においては、明治時代初期に東
</code></pre></div><h1 id="%E3%81%BE%E3%81%A8%E3%82%81">
<a class="header-anchor-link" href="#%E3%81%BE%E3%81%A8%E3%82%81" aria-hidden="true"></a> まとめ</h1>
<p>いかがだったでしょうか？</p>
<p>今回は話題のLLMでLoraを作る方法をまとめました。<br>
Macのスペック持て余している方は是非今回の手順で使ってみてください！</p>
<p>私のTwitterではLLMに限らず、AIを活用した業務改善情報の発信をしておりますのでご興味のある方は是非フォローをお願いします。<br style="display:none">
<span class="embed-block zenn-embedded zenn-embedded-card"><iframe id="zenn-embedded__e9df155a7935" src="https://embed.zenn.studio/card#zenn-embedded__e9df155a7935" data-content="https%3A%2F%2Ftwitter.com%2FLinus_lab" frameborder="0" scrolling="no" loading="lazy"></iframe></span><a href="https://twitter.com/Linus_lab" style="display:none" target="_blank" rel="nofollow noopener noreferrer">https://twitter.com/Linus_lab</a></p>


llama.cppで語尾を”ござる”に変えるloraを作る

周回ごとのアウトプットの違い

Discussion