与えられたテキストに関するinstructionを生成するモデルです。
以前公開したjimba-instructionではcalm2-chatを使用していましたが、今回は楽天が公開RakutenAI-7B-instructを使ってみました（特に理由はないです）
instructionでない文章を生成する場合もありますし、品質も安定はしないのですが、1から手作業で作るよりも遥かに簡単にinstructionを作成できると思います。

math-problem-generator_RakutenAI-7B-instruct_lora

instruction-generatorと似たような仕組みで作った、算数・数学の問題を生成モデルです。
入力として問題のジャンル（e.g. '整数の四則演算'や'図形'）を与えると、それに関する問題を作成してくれます。
四則演算系の問題はある程度安定していますが、図形系の問題は問題として破綻しているなど、あまり安定しないのが現状です。

jimba-instruction-evolver-alpha_RakutenAI-7B-instruct_lora

Evol-InstructのIn-depth evolvingを再現するモデルです。
学習に使ったデータが200件と少ないため、多様な進化をするのは難しいですが、与えられたinstructionをより複雑なものに書き換える事ができます。

データセット

pret-a-porter-instruction-v0.1

jimba-instructionと同じ手法で作成したデータセットです。
ハッカソンの期間が短かったこともあり、jimba-instructionよりも件数が減ってしまいましたが、上記のモデルを使う事で以前より効率的にデータセットを作成できたと思います。
instructionは人手でチェック・修正していますが、outputはcalm2-chatの出力をそのまま使用しているのでハルシネーションや不自然な日本語が含まれる場合があります。ご注意ください。

pret-a-porter-math-problem-v0.1

上記のmath-problem-generatorを使用して作成した算数・数学データセットです。
大半は小学校算数レベルですが、一部、修正の過程で中学・高校数学レベルになってしまった問題が含まれています。
pret-a-porter-instruction同様にinstructionは人手でチェック・修正済みです。
こちらのoutputにはaixsatoshi/Swallow-MX-8x7b-NVE-chatvector-Mixtral-instruct-v2を使用しています。
このデータセットについてもoutputの精査は行なっていないので、答えが間違っている問題が多数存在します。
こちらについてはなるべく早く修正する予定です。

jimba-instruction-simplify-200

instruction-evolverの学習に使った200対のinstructionセットです。
jimba-instructionのinstructionのうち200個をより単純なタスクに書き換えることで作成しています。

まとめ

「LOCAL AI HACKATHON #000」にて実施した、合成instructionに関する取り組みを紹介させていただきました。
それぞれの詳細な内容については後日まとめようと思います。
ハッカソン第二回の参加者募集中なので、「ローカルAIでやりたい事があるけどVRAMが足りない」って方は絶対に応募しましょう！

ハッカソンについて

ハッカソンのチームについて

成果物について

モデル

jimba-instruction-generator_RakutenAI-7B-instruct_lora