🐡
MeCabを用いた形態素解析
MeCab 概要
こちらに以前書いたので割愛
MeCab の使い方
1. mecab(オプションなし)
ラティスに沿って計算された最適なパスの 1 番目が表示される
2. -N3 オプション
ラティスに沿って計算された最適なパスの 3 番目までが表示される。-N4 だったら 4 番目
3. -p オプション
単語の区切れ目を設定して解析させることができる。その際、品詞を指定できる。
単語を入力した後、tab キーを押して、品詞を指定する(例:名詞)。
すると画像のように、そのパターンで分析される
4. -F オプション
ノードの出力形式を指定できる。基本的には画像のものだけ覚えれば良い。
それぞれが指定する出力形式は以下の通り。
- %m:形態素の表層文字列(これを入れないと「畜産」などの文字が表示されない)
- %pw:単語生起コスト
- %pc 連接コスト+単語生起コスト(文頭から累積)
- %pn 連接コスト+単語生起コスト(その形態素単独、%pw+%pC)
つまり、画像において、左から単語の生起コスト, スタートからそのノードまでのコストの累積, 生起コスト-連接コストを表している。連接コストを出したいなら、左と右を使えば導ける。
もちろん以下のようにオプションを複合して用いることも可能。
以上です。
Discussion