⛓️

🕸️KAQG:知識グラフでテスト問題を自在に生成

に公開

こんにちは!やきとりです。
最近、**質問生成(Question Generation)**の世界で注目されているテーマが増えていますね。
今回は、【KAQG: A Knowledge-Graph-Enhanced RAG for Difficulty-Controlled Question Generation】(arXiv:2505.07618 Accepted)について、ゆるくもポイントを拾いながらお届けします。

元論文情報

  • タイトル:KAQG: A Knowledge-Graph-Enhanced RAG for Difficulty-Controlled Question Generation
  • 著者 :Ching Han Chen, Ming Fang Shiu
  • 掲載 :arXiv:2505.07618 (cs.IR) Accepted
  • リンクhttps://arxiv.org/abs/2505.07618

✒ 論文を一言でまとめると?

知識グラフ(KG)を使って、取り出した事実のつながりをもとに「簡単〜難しい」まで調整可能なテスト問題を自動生成する仕組みを作った

🤔 質問生成って何?

  1. 概要レベル
    • 文章やデータから自動的に「問い」を作り出す技術。
    • 教材作りの手間を減らしたり、自己学習アプリで活用されたりする。
  2. 応用レベル
    • eラーニングで難易度に合わせた練習問題を大量に用意
    • 試験の過去問データをもとに新しいバリエーション問題を生成

例えると…

  • 🧩 「バラバラのパズルピース(知識グラフのノード)があって、そこからどのピースをどれだけ組み合わせるかで、簡単〜難しいパズル(問題)ができるイメージ」です。

⚠️ 従来の問題点

  • 推論過程が見えにくい:RAG(Retrieval-Augmented Generation)だと「なぜこの根拠を使ったか」がブラックボックス化しがち。
  • 難易度調整が粗い:生成後に手動でレベル分けする必要があり、自動化が不十分。

🚀 本論文の革新ポイント

✨ ポイント1:知識グラフ×RAGによる多段階推論

  • ドメイン文書を構造化してグラフ化→グラフ-awareな検索で「事実の連鎖(fact chain)」を抽出→LLMに渡すフロー。
  • どのノードをたどったかが明示され、推論の根拠がトレース可能に!

✨ ポイント2:Bloom’s Taxonomy+IRTで細かく難易度制御

  • 教育評価理論のブルームのタキソノミー項目反応理論(IRT) を融合。
  • 生成プロセス中に「理解」「応用」「分析」などレベル指定や、IRTパラメータを反映して問題を設計。
  • 結果のIRTパラメータが専門家基準と一致!

🔬 実験結果ハイライト

  • トレース可能性:推論ルートの正答率が従来比+15%
  • 難易度一致:IRT推定値と専門家評価の相関係数0.87
  • 再現性:GitHub上でデータ・スクリプト一式公開済み

🌱 今後の可能性

  • 💡 多教科横断の問題生成プラットフォーム化
  • 💡 動的テスト(adaptive testing)への応用でより個別最適化
  • 💡 教育データ分析と結びつけたパーソナライズ学習支援

📝 まとめ

  1. 知識グラフを活用して推論過程を可視化
  2. 教育評価理論で難易度を自在にコントロール
  3. 再現性高く、研究・実装コミュニティに貢献

次回もお楽しみに!

Discussion