🔷

[自分用ツール]自然言語分析ツールを作ってみた

に公開

はじめに

自然言語処理を勉強していてテキストマイニングというものをこの本で知りました。

コーパスとテキストマイニング - 共立出版 (2012) 石田 基広 編著・ 金 明哲 編著
https://www.kyoritsu-pub.co.jp/book/b10007205.html

ですが書籍内で紹介されているテキストマイニングツールが私の環境からでは使えなくなっていたため
書籍の内容を参考に自分でもある程度の分析ができるようツールをJanomeというライブラリを駆使して開発してみました。
とはいっても個人的にローカルで使う想定なので
Webサービス化などはしていませんしDockerファイルとかもありません^^;

https://github.com/otsukimi-tanuki/csvtext-analyzer

使い方

0. アプリケーションを立ち上げる

README.mdにしたがってバックエンド、フロントエンドを立ち上げてください。

1. CSVファイルをアップロードする

フロントエンドのトップページから分析ファイルのCSVファイルをアップロードしてください。

2. データを確認する

LLMに作ってもらったCSVファイルを今回はアップロードしてみました。下のようになりますので
「次へ:カラム選択」のボタンを押してください。

3. 分析対象の列を選ぶ

ここでは分析対象のテキスト(text)と、そのクラス分け(category)をラベルとして選択し
最下部の「分析」ボタンを押します。

4. ダッシュボードが開く

ダッシュボードからデータを眺めたりテキストの分析結果を利用できます。

頻出単語を見たり…

カテゴリ分類をもとにしたTF-IDFを見たり。

おわりに

今回は私が作ったツールの紹介をしましたが、ぜひよいツールなどありましたらご教示ください。

Discussion