🐡

MeCabを用いた形態素解析

2024/10/30に公開

MeCab 概要

こちらに以前書いたので割愛

MeCab の使い方

1. mecab(オプションなし)

画像

ラティスに沿って計算された最適なパスの 1 番目が表示される

2. -N3 オプション

画像

ラティスに沿って計算された最適なパスの 3 番目までが表示される。-N4 だったら 4 番目

3. -p オプション

画像

単語の区切れ目を設定して解析させることができる。その際、品詞を指定できる。
単語を入力した後、tab キーを押して、品詞を指定する(例:名詞)。
すると画像のように、そのパターンで分析される

4. -F オプション

画像

ノードの出力形式を指定できる。基本的には画像のものだけ覚えれば良い。
それぞれが指定する出力形式は以下の通り。

  • %m:形態素の表層文字列(これを入れないと「畜産」などの文字が表示されない)
  • %pw:単語生起コスト
  • %pc 連接コスト+単語生起コスト(文頭から累積)
  • %pn 連接コスト+単語生起コスト(その形態素単独、%pw+%pC)

つまり、画像において、左から単語の生起コスト, スタートからそのノードまでのコストの累積, 生起コスト-連接コストを表している。連接コストを出したいなら、左と右を使えば導ける。
 
 
 
 

もちろん以下のようにオプションを複合して用いることも可能。
画像
 
 
 
 
以上です。

Discussion