Closed8
MecabをUTF-8でインストールしたい
デフォルトでMecabは本体、IPA辞書ともにEUC-JPで出力される、UTF-8で出力されるようにしたい
から MeCab本体とIPA 辞書 のtar.gzをダウンロードして解凍
Mecab本体
tar xvfz mecab-x.x.tar.gz
cd mecab-x.x
./configure --with-charset=utf8
make
make check
sudo make install
IPA辞書
tar xvfz mecab-ipadic-x.x.tar.gz
cd mecab-ipadic-x.x
./configure --with-charset=utf8 --enable-utf8-only
make
sudo make install
nkf
を使って自分でEUC-JPからUTF-8へエンコする記事があったけど壊れたので、--enable-utf8-only
でIPA辞書側で勝手にエンコしてもらう方が安全だと思う
brew install mecab
/ brew install mecab-ipadic
するとbrewの中身書き換えに行かないといけないからこっちの方が良さそう。
もしミスっても本体辞書ともにsudo make uninstall
でクリーンアップ可能。
Cabochaも同じ、ただしMecab / IPA辞書 / CRF++が依存関係にあるので先にCRF++
を入れる
CRF++
https://taku910.github.io/crfpp/
から CRF++本体の tar.gz をダウンロードして解凍
tar xvfz CRF++-x.x.tar.gz
cd CRF++-x.x
./configure
make
sudo make install
CRF++のビルド出力は/usr/local/include
に追加される
Cabocha
https://taku910.github.io/cabocha/
から CaboCha 本体の tar.gz をダウンロードして解凍
tar xvfz cabocha-x.x.tar.gz
cd cabocha-x.x
./configure --with-charset=utf8 --enable-utf8-only
make
sudo make install
この時g++(CXX)のinclude pathに/usr/local/include
がないときにinclude cannot resolveする
MakefileのDEFAULT_INCLUDES
に/usr/local/include
を追加しよう
- DEFAULT_INCLUDES = -I. -I$(top_builddir)
+ DEFAULT_INCLUDES = -I. -I$(top_builddir) -I/usr/local/include
このスクラップは3ヶ月前にクローズされました