😽

CaboChaを用いた係り受け解析

2024/11/06に公開

CaboCha とは?

係り受け解析ツールです。形態素解析をした後で、語句の修飾関係を明らかにするものです。
それをするツールの一つが CaboCha です。

環境構築(Mac)

先に MeCab をインストールしておく必要があります。
その上で、brew install cabochaで行けます。

使い方

1. cabocha(オプションなし)

cabocha -f0 でも同じ。コマンドを入力してから、文章を入力してエンター。係り受け構造を示してくれる。

画像

縦で見たときに、D の位置が係る先を示している。
この画像であれば、太郎は ⇨ 渡した, 借りてきた ⇨ 本を, 本を ⇨ 渡した, 花子に ⇨ 渡した

2. -f1 オプション

MeCab のようにそれぞれの句に分割し、品詞も分析してくれる。

*で始まる行は左から順に文節番号、係先の文節番号、主辞/機能語の位置、係関係のスコア

  • 主辞:それだけで意味を持つ単語
  • 機能語:それだけで意味を持たない単語
  • スコア:この数値が高いほど係りやすい

画像

3. -f2 オプション

1, 2 の組み合わせ

おまけ: ふりがな文庫ラボ

ふりがな文庫ラボでは、CaboCha で分析した係り受け構造をわかりやすく図示してくれるサイトです。
画像

ツリー構造だけで良いならこっちで良いですね。
 
 
 
 

以上です。

Discussion