Chapter 01

はじめに

ikawaha
ikawaha
2021.07.26に更新
このチャプターの目次

本書は形態素解析器 kagome のリファレンスマニュアルです。
kagome は Go で書かれていて、辞書を内包する形式を取っています。kagome を利用したプログラムは、辞書をバイナリに含めることになるので、辞書リソースを別途配布することなく、1バイナリでプログラムを配布できます。

  • Pros:意図しない辞書バージョンの利用や辞書の位置の指定でのトラブルがなくなる
  • Cons:辞書の分だけプログラムサイズが大きくなる

kagome は Lucene で利用されている形態素解析器 kuromoji に触発されてつくられた形態素解析器で、源をたどれば MeCab の解析部分の再実装といえます。動作については、概ね kuromoji の機能を実装していて、解析に関しては未知語以外は MeCab と同等です。

辞書は IPADIC、UniDIC の2種類の辞書をサポートしています。

辞書 ソース package
MeCab IPADIC mecab-ipadic-2.7.0-20070801 github.com/ikawaha/kagome-dict/ipa
UniDIC unidic-mecab-2.1.2_src github.com/ikawaha/kagome-dict/uni

また、実験的ではありますが、NEologd と Korean MeCab も利用可能です。

辞書 ソース package
mecab-ipadic-NEologd mecab-ipadic-neologd github.com/ikawaha/kagome-ipa-neologd
Korean MeCab mecab-ko-dic-2.1.1-20180720 github.com/ikawaha/kagome-dict-ko

kagome の情報源について以下に示しておきます;

改訂履歴

日付 バージョン 改訂内容
2021-06-08 v0.4.2 形態素解析コマンドのJSON出力オプションについて追記しました
2021-06-08 v0.4.1 形態素解析コマンドの文区切りオプションと文区切りサブコマンドについて追記しました
2021-06-02 v0.4.0 ユーザー辞書の使い方おまけ:○○を支える技術の章を追加
2021-04-02 v0.3.1 コマンドのインストール方法を Go 1.6 形式に修正
2021-04-02 v0.3.0 WebAssembly で利用するの章を追加
2021-01-03 v0.2.0 goroutineと共に利用するの章を追加
2020-12-19 v0.1.0 言語処理100本ノックのサンプル回答の章を追加
2020-12-13 v0.0.0 初版作成