Chapter 07

辞書をカスタマイズする

ikawaha
ikawaha
2020.12.14に更新

kagome では組み込み用の辞書を用意していますが、これを自分で用意して import して利用することも可能です。

IPADIC をカスタマイズする

note. UniDic も同様です

  1. https://github.com/ikawaha/kagome-dict を clone する
  2. go.mod もモジュール名を clone した環境に合わせて github.com/ikawaha/kagome-dict から変更する
  3. kagome-dict/ipa/tool フォルダに移動。(以下、ここを作業フォルダとします)
  4. mecab-ipa-dic-2.7.0-20070801.tar.gz を持ってきて展開
  5. 展開された mecab-ipa-dic-2.7.0-20070801 フォルダの辞書内容をカスタマイズする
  6. go get github.com/ikawaha/go-bindata してコマンド go-bindata を作成しておく
  7. build.sh を実行
  8. 自分のリポジトリに PUSH

NEologd をカスタマイズする。もしくは最新版を利用する

作業は IPADIC の場合とほぼ同等です。

  1. https://github.com/ikawaha/kagome-dict-ipa-neologd を clone する
  2. go.mod もモジュール名を clone した環境に合わせて変更する
  3. kagome-dict-ipa-neologd/tool フォルダに移動。(以下、ここを作業フォルダとします)
  4. mecab-ipa-dic-2.7.0-20070801.tar.gz を持ってきて展開
  5. NEologd の seed フォルダを持ってくる
    • 中身は csv.xz なので、展開して csv に戻しておきます
  6. go get github.com/ikawaha/go-bindata してコマンド go-bindata を作成しておく
  7. build.sh を実行
  8. 自分のリポジトリに PUSH