ACL2020のsentiment analysisまとめ
はじめまして、@uchi_k と申します。
先日ACL2020分野サーベイLT会というイベントを開催し、sentiment analysisカテゴリの論文を全部読んだまとめについて話しました。
イベントはこちら。
ACL2020 分野サーベイLT会
資料はこちら。
アーカイブ動画はこちら。
ただ、発表時間の制約もありどうしても話しきれなかった部分があるので、特にACL全体と分野全体の傾向の話を補完してみようと思います。
ACL全体の傾向
大きく分けて4つです。
1. 生成系・グラフ系の論文が増えた
ここ近年ずっとですが、生成系・グラフ系の論文が多かったように思います。
Transformerで大抵のことはできるようになったので、より難しい生成系のタスクに手を伸ばしやすくなったこと、
グラフからの機械学習の研究が近年盛り上がっていることから「より洗練されたデータ表現として」グラフ構造を使いやすくなったことあたりが理由かと思います。
2. BERT等の事前学習言語モデルに関する言及がほぼ必ずある
BERTが出始めたのは2018年頃ですが、それ以降派生の事前学習言語モデルが出まくって、構文解析系のタスクにあまり注意を払わなくても下流タスクが解けてしまう状況が生じました。
(比較可能なものについては)「それって結局BERTでいいんじゃないの?」と言われてしまわないようしっかり比較している論文がほとんどでした。
3. 再現性の視点や実務への応用から、指標の見直しが進んだ
何らかのベンチマークに対しSoTAを更新できたかを競っている現状は、前処理やハイパーパラメータ等のハックが効いてしまったり結果として再現性のない論文が量産されてしまったりする点でよろしくないのでは、という問題意識が広まってきているように思いました。
ベストペーパーの Beyond Accuracy: Behavioral Testing of NLP Models with CheckList でも、NLPタスクに対しテストケースのようなものを定義し通過率を見る、といったソフトウェア的な運用が念頭にあるような新しい指標が提案されていたりしました。
4. Knowledge Graph に回帰
Knowledge Graph上での演算や埋め込み、外部知識として用いた学習などの話が増加しています。
グラフからの機械学習が近年注目されていることもあって、その分野から手法を持ってきて適用している論文も多いです。
sentiment analysis
続いて、sentiment analysisについて
- 全体の傾向
- 問題意識と解決策、気になった論文
の順に紹介します。
全体の傾向
sentiment analysis 全体の傾向についてです。
今回このまとめを作るにあたって、ACL2020 の sentiment analysis, stylistic analysis, argument mining タグが付いた論文を全部ざっくりですけど読んでみました。論文数は32です。
一番感じたのはレビューコメント等の user generated contents のマイニングがかなり多いということで、、産業応用を志向した研究が多い分野なのかなと思います。純粋なアカデミックの論文は他の分野より少ない感じがしました。
user generated contents の解析は、アスペクト、つまり商品のカテゴリや使用状況ありきの感情認識になることが多いのでアスペクトベース感情分類の論文が多く、ついでアスペクト識別もだいたい同じモチベーションです。
感情原因ペア抽出は近年盛り上がっているタスクで、感情とその原因をペアで抽出するというタスク。あとは感情認識用の前処理の問題意識だったりデータの作り方だったり、タスクの特殊性にデータで対処する感じの論文がありました。
問題意識と解決策、気になった論文
問題意識として多いのは、
- データが少ない
- 個別タスクのつなぎ合わせで相互作用を考慮できていない
- 新しく出現したソーシャルタスク
の3つでした。
それぞれの解決策と、気になった論文を紹介していきます。
1. データが少ない
データが少ない問題に対しては、別言語リソースの利用、別ドメインの利用、外部知識グラフの利用、効率的なアノテーション、データ拡張等で対処している論文がありました。
データが少ない問題への対処例:別言語リソースの利用
別言語リソースを利用している例として、Cross-Lingual Unsupervised Sentiment Classification with Multi-View Transfer Learningを紹介します。
この論文では、資源の少ない言語について、教師なし機械翻訳と言語判別器を使った教師なし言語横断センチメント分類モデルを提案しています。
翻訳機と言語判別機を使って言語adversarialな学習をすることで言語普遍な特徴空間を学習する、domain adaptation的な方法論を使っています。
発想はこれまでにもあったものですが、言語adversarialってあまり聞いたことがないと思いましたし、論文を見ると細かい配慮が見えました。
他の手法よりざっくり試せるというか、ソースの制限が少ないのが特徴かと思います。
データが少ない問題への対処例:別ドメインの利用
別ドメインを利用している例として、Adversarial and Domain-Aware BERT for Cross-Domain Sentiment Analysisがあります。
この論文は、一言で言うとsentiment classificationのデータを十分に確保するためにdomain-awareかつcross-domainな手法をadversarialな方法論で実現しています。
具体的には、本来ドメインを認識しないBERTをdomain-awareに学習するためにドメインをマスクした言語モデリングタスクを設定、さらにcross-domainにするためにdomain-adversarial trainingを行っています。
データが少ない問題を教師なしドメイン適応の問題に落とし、それをBERTを使って実現している点が新しいです。
データが少ない問題への対処例:効率的なアノテーション
続いて、アノテーションの効率化をしているEfficient Pairwise Annotation of Argument Qualityでは、argument qualityという測定しづらくデータも少ないタスクに対して、クラウドソーシングしたペアワイズ判定から高品質なラベルを推定する、ということをしています。
手法はシンプルで、Bradley-Tellyモデルという、トーナメントの結果のようなペアワイズなデータから潜在的な強さだったり良さを推定するというものを応用しています。
データが少ない問題への対処例:データ拡張
最後にデータ拡張で対処している例としてConditional Augmentation for Aspect Term Extraction via Masked Sequence-to-Sequence Generationを紹介します。
この論文では、アスペクト用語抽出(レビューテキストからアスペクト用語を抜き出し、センチメント分析の意見の対象として抽出する)で十分なアノテーションデータが無い問題に対し、データ拡張を条件付きオーグメンテーションと定義したmasked seq2seqを提案しています。
制御できるデータ拡張で、実際にデータ不足に効いているっぽく、これ系は自分でやってみなければ信用できないものの面白そうだと思いました。
2. 個別タスクのつなぎ合わせで相互作用を考慮できていない
アスペクトベースセンチメント分析などで、アスペクト用語抽出→意見用語抽出→アスペクトレベルセンチメント分析、のように分断されたタスクのシーケンスを実行していくような手法に対し、うまく相互作用が考慮できていない点を指摘して中間情報の利用方法の提案やend-to-endな手法の提案を行っているものも多かったです。
例えばRelation-Aware Collaborative Learning for Unified Aspect-Based Sentiment Analysisは、前述のアスペクトベースセンチメント分析で、意見がおいしいなのにアスペクトが食べ物ではなく場所になったりする問題点を指摘し、マルチタスク学習にアスペクト用語の関係性を入れ込んだRelation-Aware Collaborative Learningというのを提案しています。
3. 新しく出現したソーシャルタスク
主にSNSで、新しく出現したタスクを扱っているものも多くありました。
例えばHe said “who’s gonna take care of your children when you are at ACL?”: Reported Sexist Acts are Not Sexistでは、sexism 的な投稿の検出に加えて、その対象が個別なのかグループなのか、や経験談なのかなどまで踏み込んでいます。
Out of the Echo Chamber: Detecting Countering Debate Speechesでは、エコーチェインバーの中で反対意見にアクセスしにくくなっている現状に対し、「与えられた議論に最も効果的に反論している記事を検出する」タスクを解くことで対応しています。
まとめ
以上、ACL2020のsentiment analysisカテゴリの論文を全部読んだまとめでした。
個人的にはUGC解析系と新しい問題に対処している系が興味深かったです。今回紹介しませんでしたが、議論の説得力の予測やストーリーからの感情の動きの予測など、今はちょっとアレでも数年後に面白い実用が生まれる可能性がありそうなものもいくつかありました。
また、全部読んだとはいえざっくりなので、理解が甘いところもあるかもしれません。。。もし間違いを見つけられた方は、こちらか僕のTwitter(@uchi_k)までご意見いただけますとありがたいです。
出典
論文について紹介している箇所では、論文の図をそのまま引用しました。それ以外のスライド画像は、冒頭に紹介した自分が書いた資料から引用しています。
Discussion