👌

NLP2024 クイズ関連

2024/03/20に公開

自然言語処理

※逐次更新する

NLP2024

https://www.anlp.jp/nlp2024/

NLP2024タイトル検索
 NLP2024アブストラクト一覧ページ

※オンライン聴講のみ。しかも一部のみ。読んでいないもの、聴講していないものが多数。
※スライド・ポスターは参加者かぎり。

タイトルに「クイズ」を含むもの

A1-5 多様なクイズを自動生成する手法およびその検証
○小林俊介, 河原大輔 (早大)
- 多様性のあるクイズを作りたい。
- QAでのFusion-in-Decoderに着想して、正解と複数コンテキストそれぞれをエンコードしたものを結合してから、問題を生成。複数文書を意識した問題になることを期待。
- 解答とコンテキストから問題生成する形式から、コンテキストから問題と回答を生成する形式へ。
- 多様性を念頭に学習時の損失も制御。
- ※複数のコンテキストをエンコードして結合して与えているが、だからとそれぞれのコンテキストを反映するようになるとは言い切れないかも。とくに狙っているはずの複数コンテキストの情報を組み合わせないと解けないことをどう実現するか(。。。はNLP2023分だったか)
E2-3 嘘がなく、面白いクイズの自動生成
○島田克行, 折原良平, ~~森岡慎太~~森岡靖太, 市川尚志 (キオクシア)
　- ※氏名チェックが甘いままOKを出してしまった..
- wikipedia記事のそれぞれの文がクイズの素材として選ばれやすいか（＝面白い）、既存のクイズの問題文との文類似度に基づいたランキングけモデルを提案し、これを用いて記事からクイズにすれば面白いだろう文を推薦する。作問例として、それをもとにone-shot-promptingにてChatGPTにて作問させた。
- ※クイズの問題文に選ばれる内容には何らかの特徴があって、それをつかみたい研究。その特徴を説明できるようになると、よいのだろうと思う。前振りと後限定それぞれに適した文というのもあるだろう。また、前振りと後限定それぞれ独立に選択して結合させればよいというものでもないだろう。
C3-6 絵本を題材とするクイズの生成と評価
○水上雅博, 藤田早苗, 小林哲生 (NTT)
- 先行研究のほとんどは「大人」の「一般常識」を問うクイズ。本研究は「子ども」の「読んだ絵本」の理解度を問うクイズ
  - 絵本を読んでいない子どもはわからない
  - 絵本を読んだ子どもなら簡単に答えられる
  - 絵本以外の知識を要さず，一般常識などからくる推測が不要
- 絵本150冊に対して人手でクイズデータを作成。インストラクションチューニング用の形式に変換
  - いきなりクイズと回答の両方を生成するのは難しいと想定。学習データの量が少ない，生成の自由度が高すぎる
  - 回答を指示に含めたうえで，クイズのみ生成するタスクを設定 (※ answer-aware-question-generation)
    - (1) 単語親密度などの基準で回答を選択可能にする→今後の課題として難易度調整等を想定
    - (2) 生成したクイズの人手評価および答え合わせを簡略化する→人手評価のコスト
- tsuzumi 7BをLow-Rank Adaptation
- 質問応答や質問生成とのroundtripのマルチタスク設定を含めて、全部入り設定が最良。
  - refがクイズ生成の評価に強く影響
  - 最良のモデルの生成結果で，50%が「絵本のクイズとして妥当」，30%が「答えに対しても妥当」
  - マルチタスク学習はうまく動いたが，クイズ生成の評価には寄与しなかった
    - ※以前、T5ベースでやった時も似たような感じだったな。。
- 今後
  - 生成したクイズで「子どもの絵本の理解度」を測れるか調査
  - ハルシネーションに起因する不適切なクイズ文の抑制
  - （誤答も含めた） 4択問題の生成
P5-3 早押しクイズの名数問題における解の妥当性を考慮した解答をするための CoT プロンプトの構築
○杉山宏輝, 角康之 (未来大)
- 問題文の前半（前振り）で名数(夏の大三角、四大文明、五大湖など)が提示され、後半でその要素を列挙し、残り1つを問う形式の構文について、CoT(Chain-of-Thought)思考過程をいくつかのステップに分けて考えることで、精度の向上を図る手法
  - ※要は、どの選択肢が最後に来るか＝正解かをCoTプロンプトにて順序だてて予測させるもの。
- 思考過程の有無が最終的な答えに影響を与えることを確認。解答内容に偏りが見られた（順序23%, 難易度7%, 類似3%, 仲間外れ0.6%, その他66%)
- StableLM7b+標準プロンプトの正解率0.1547 → StableLM7b+CoT 0.1977
- ※クイズであればこう問われるはずだとどこまで想像できるか。CoTでの例示次第でもう少し向上させられるかもしれない。
- ※評価はAI王データセットだが、LMの学習データに含まれているのではないかと危惧する。huggingface datasetで容易に手に入るし。
- ※そのまま、クイズ生成にも使えるか。読まれやすいパターンの問題を作りやすくなるが。
D7-3 早押しクイズにおける超次単語予測の認知モデリング
○山下陽一郎, 原田宥都, 大関洋平 (東大)
WS3: JLR2024 : 4択クイズを題材にした多肢選択式日本語質問応答データセットの構築
○鈴木正敏 (東北大/StudioOusia)
- 併設ワークショップ「日本語言語資源の構築と利用性の向上 (JLR2024)」
言語モデルが保持する実世界の事物に関する知識（世界知識）を評価するベンチマークとして、高品質な質問応答データセットは不可欠である。近年、日本語に特化した複数の大規模言語モデルが開発・公開されているが、それら日本語のモデルが持つ世界知識を評価するために利用可能な日本語による質問応答データセットは少なく、日本語の自然言語処理研究の進展を遅らせる要因となっている。そこで我々は、日本語の質問応答データの題材として、国内のクイズ大会で実際に使用された4択クイズの問題を用い、日本語の多肢選択式の質問応答データセットを構築した。本発表では、構築したデータセットの特徴について紹介するとともに、データセットを用いて既存の日本語大規模言語モデルを評価した実験の結果について報告する。

参考：論文誌：AI王解答部門の分析

クイズコンペティションの結果分析から見た日本語質問応答の到達点と課題
有山知希, 鈴木潤, 鈴木正敏, 田中涼太, 赤間怜奈, 西田京介
自然言語処理, 2024, 31 巻, 1 号, p. 47-78, 公開日 2024/03/15
- AI王3 (問題解答部門だけの頃)までの結果に基づく。後で読む。

参考：参加者ブログなど

#NLP2024 にエア参加してみた #NLP2024, - Qiita
- 松林逹史さん@今はどこ?
  
  P11-10 文を入力とした俳句の自動生成
  GPT-2 をFinetuning。API使ってGPT-3.5 turbo をFTした方が良いんじゃないか？というのは気になるところ。なんなら評価もGPT-4 にもやらせてみるべきだよね、とは思う。去年のNetEcoでも俳句生成の話が上がって、「これからはChatGPTに駆逐されるのでは？」という話が上がったのだが、個人的には結局俳句の評価の研究はまだまだ残ると思ったので気にはなる分野。あと、俳句系の研究見るといつも思うんだけど、伊藤園の“伊藤園お～いお茶新俳句大賞”のデータって研究目的ならクロールして使っていいのだろうか？　https://itoen-shinhaiku.jp/
学会を楽しむ余裕が必要だ - 超言理論
- 水上雅博さん@NTT-CS研 C3-6の発表者
  
  昨年の言語処理学会ではクイズに関する研究が複数あり，今年もAI王などのクイズに関する取り組みがあったため，多数の，セッション1つくらいの発表があるかなと思ったが，予想に反してクイズに関する発表を集めたセッションはなく，質問応答や言語生成などのセッションに散らばっていた*4．
  
  特に，自分の発表，参加したセッションの後はそのセッションで近い発表をしていた人や，興味のある人に声をかけて突発懇親会的なことが行われたりする．私もクイズに関する研究をやっている人や，学会でよく会う研究者と懇親したい気持ちはあったが，時間が許さず残念ながら今年は発表，質疑，コーヒーブレークでしか人と話す機会が少なく，ちょっと時間不足だったなと思う．
  
  研究の主題とする部分（クイズはあくまで題材であって，主題は"言語生成結果の多様さの向上である"とか）の関係や，交流機会の創出のためにわざと複数のセッションに散らしている可能性もあるので，一概にどうこう言えるわけではないことには注意しなければならない
言語処理学会第30回年次大会に参加しました！ - Helpfeel Developers' Blog
- teramotodaikiさん@helpfeel
  
  最初に聴講したのは、早稲田大学の小林俊介さんによる「多様なクイズを自動生成する手法およびその検証」という発表でした。クイズ番組に使われるようなクイズを自動生成するために、言語モデルを学習する試みです。
  Helpfeelでも文書から質問文を生成する研究を行っているため、大変勉強になりました。１つのクイズを作るために複数の文書をミックスする発想がとくに面白いと感じました。
言語処理学会第30回年次大会（NLP2024）に参加しています - Helpfeel Developers' Blog
- nishiyamaさん@helpfeel
  
  E2:データ生成のセッションでは、E2-3「嘘がなく、面白いクイズの自動生成」が面白かったです。早押しクイズではしばしば回答タイミングを先延ばしにする「前フリ」がありますが、そうした分析を経たうえで「面白い」クイズをChatGPTで作問するという内容でした。

参考: JSAI2024

2024年度人工知能学会全国大会（第38回）/ [4G3-GS-2-04] RAGとSelf-Refineを用いたクイズ生成 (2024-05-31)
- AI王4 クイズ作問部門の参加システム

参考: AI王4

AI王〜クイズAI日本一決定戦〜 - 第4回
- AI王〜クイズAI日本一決定戦〜 - 最終報告会 (2024-01-26)

Discussion

ログインするとコメントできます

NLP2024 クイズ関連

NLP2024

タイトルに「クイズ」を含むもの

関連：言葉関連の遊び・クリエイティブ

関連：質問生成・問題作成・評価・難易度制御など

関連：事実検証など

関連：解説生成

関連：その他

参考：論文誌：AI王解答部門の分析

参考：参加者ブログなど

参考: JSAI2024

参考: AI王4

Discussion