🧱
日本語入力システムSumibiの開発 part9:ローカルLLMを試してみた

2025/05/30に公開
 はじめに前回は、ビックテックの代表OpenAIとGoogleの代表的なLLMのベンチマークを取り比較しました。私が開発したローマ字仮名漢字変換「Sumibi」はOpenAIのAPIを呼び出してローマ字から漢字変換するOSSです。Windowsマシン(メモリ16GByte)にLLM Studioをインストールし、そこそこ動くモデルを選んで遊んでみました。しかし、小さいローカルLLMではあまりにも変換精度が悪いので、どれくらいのパラメータ数のモデルまで引き上げれば、変換精度が出るのか調べてみました。

 結論ローカルLLMはSumibiには使えないベンチマークを取ってみた感想として、ビッグテックのLLMとは違い、ローカルPCで動かせるサイズのLLMでは全く変換精度が出ません。どこまでパラメーター数を引き上げればいいのかの結論が出ないまま、予算的な都合で諦めてしまいました。AWS上のGPUインスタンスを使って、パラメーター数100Bまでやってみましたが、良い結果は出ませんでした。

このベンチマークのためにEC2とEBSに$65.64(約10000円)使いました。お金は使いましたが、結局、結果は出ませんでした。次の追試は一年後くらいでしょうかね…
ローカルLLMのベンチマーク結果
https://zenn.dev/kiyoka/articles/japanese-input-method-sumibi-1

https://zenn.dev/kiyoka/articles/japanese-input-method-sumibi-2

https://zenn.dev/kiyoka/articles/japanese-input-method-sumibi-3

https://zenn.dev/kiyoka/articles/japanese-input-method-sumibi-4

https://zenn.dev/kiyoka/articles/japanese-input-method-sumibi-5

https://zenn.dev/kiyoka/articles/japanese-input-method-sumibi-6

https://zenn.dev/kiyoka/articles/japanese-input-method-sumibi-7

https://zenn.dev/kiyoka/articles/japanese-input-method-sumibi-8
はじめに

結論ローカルLLMはSumibiには使えない

Discussion