言語処理学会第31回年次大会(NLP2025)参加報告
こんにちは、株式会社松尾研究所シニアデータサイエンティストの大西です。
3/10〜3/14に長崎で開催された言語処理学会第31回年次大会(NLP2025)にシルバースポンサーとして、データサイエンティスト3名と人事1名が参加しました。
本イベントは、自然言語処理(NLP)分野の最先端研究が集まる場であり、大学研究者や企業が最新の成果を発表し、活発な議論をおこないます。今年は、参加者2248名、発表777件、スポンサー103社と、いずれも過去最高の件数を記録したとのことでした。
私たち松尾研究所は、先端研究の社会実装を重視して技術開発を行ない、その成果を外部公開することで社会全体のAI開発の底上げを担っています。今回のNLP2025では、その一環としてパナソニックHD様と共同研究を行った「松下幸之助」再現AIシステムの研究成果について口頭発表を行いました。
口頭発表 「松下幸之助」再現AIシステム
D9-3 「松下幸之助」 再現AIシステムの開発
著者: 大西 直 (松尾研究所), 高岸 智 (パナソニックHD), 鎌田 理久 (松尾研究所), 山西 宏平 (パナソニックHD), 神崎 雄介, 小林 拓, 徐 暁琳, 菅原 陸, 杉浦 いぶき, 篠崎 友悠 (松尾研究所), 河村 岳 (パナソニックHD)
概要:パナソニックHD様と松尾研究所が共同で、創業者の思想と発言を忠実に再現「松下幸之助」AIシステムを開発しました。音声認識、返答生成、音声合成、動画生成の4つのAIモデルを統合し、データクレンジングとドメイン知識の活用により、松下幸之助らしい対話体験を実現しています。
以前プレスリリースにて発表したパナソニックHD様との共同開発成果について発表を行いました。
以下の3つの工夫のうち、データクレンジングにおける返答生成部分の工夫について口頭発表を行いました。
- データクレンジング
- 処理時間の高速化
- ドメイン知識による改善
発表後、ドメイン知識による改善部分に関する質問を多くいただきました。今後の課題や質問を踏まえ、以下の2点が今後の研究課題として重要だと捉えています。
- LLMと専門家による評価を今後どのように近づけるか
- LLMによる評価自動化(LLM-as-a-Judge)が可能か
松尾研究所データサイエンティストが注目した研究
データサイエンティスト3名それぞれ2件ずつ、本学会で特に興味深かった研究について以下にまとめました。
-
P7-7 chakoshi: カテゴリのカスタマイズが可能な日本語に強いLLM 向けガードレール
著者: 新井 一博, 松井 遼太, 深山 健司, 山本 雄大, 杉本 海人, 岩瀬 義昌 (NTT)
概要:NTTコミュニケーションズ様が開発した「chakoshi」は、日本語特有の表現やニュアンスに対応したLLM向けガードレールモデルです。日本語特有の表現(皮肉・ハラスメント・ネット用語など)に強く、防ぎたい話題を自然言語でカスタマイズ可能となっており、軽量なモデル(gemma-2-9b-it)をベースに構築されています。
感想:AI Safety研究の多くは理論的側面や実験環境での検証に留まることが多い中、本研究は明確な実用目的を持って進められている点が特徴的だと感じました。特に、日本語に特化し、組織ごとにカスタマイズできる柔軟性を持たせている点が良かったです。今後、こうした特定言語や特定ユースケースに特化したAI Safetyソリューションの開発がさらに進むことで、AIの安全な社会実装が加速することを期待しています。 -
D8-6 日本語Full-duplex音声対話システムの試作
著者:大橋 厚元, 飯塚 慎也, 姜 菁菁, 東中 竜一郎 (名大)
概要:名古屋大学の研究チームが開発した「日本語Full-duplex音声対話システム」(J-Moshi)について紹介しています。通常の音声対話システムでは相手の発話終了を待ってから応答しますが、Full-duplex対話では人間同士の自然な会話のように発話のオーバーラップや相槌などの同時双方向的な特徴を持つ対話を実現します。
感想:実際の発表で聞いたところ、応答速度が速く自然な対話に感じました。論文中にファインチューニング用データとして、全344時間中の雑談対話コーパスと相談対話コーパス合わせて201時間あり、自然な対話に向けてこれらのデータセットを整備することが大切だと感じました。 -
P8-1 検索付き拡張生成におけるハイパーパラメータとプロンプトの同時最適化
著者:鈴木 海渡, 水野 尚人, 柳瀬 利彦, 佐藤 元紀 (PFN)
概要:RAGにおけるハイパーパラメータとプロンプトを最適化するフレームワークを提案しています。それぞれOptunaと遺伝的アルゴリズムが使用されています。
感想:業務で実際にハイパーパラメータやプロンプトの調整に苦労したことがあり、これらを自動調整できると非常に便利になります。今後これらの手法がさらに発展し、より精度良く多くのタスクに適用されることが期待されます。 -
Q7-16 LLM埋め込みと遷移確率予測を利用した実店舗内顧客行動シミュレーション
著者:宮本 遼人 (早大), 春日 瑛 (サイバーエージェント)
概要:実店舗でのユーザの行動をシミュレーションするための手法を提案しています。LLM埋め込みと遷移確率予測を組み合わせて、ユーザの行動をモデル化しています。
感想:実店舗でのユーザの行動をシミュレーションすることは、マーケティングや店舗運営において非常に重要ですが、難易度の高い課題です。松尾研究所でも空調制御にLLMを活用した研究を行っており、リアルワールドで様々な場面でLLMの活用が進んでいることを実感しました。 -
Q10-25 ニュース記事中の企業名のEntity LinkingにおけるQuestion Answeringを用いた曖昧性解消
著者:齋藤 慎一朗, 髙橋 寛治 (Sansan)
概要:ニュース記事に登場する企業を一意に特定する作業(Entity Linking)をLLMのQuestion Answeringを用いて実施することで従来の類似度ベースの手法よりも大幅に性能改善を達成した論文です。
感想:実業務でほぼ同じタスクを実施していることもあり、実施している内容自体非常に参考になりました。また、特定できなかった場合のWeb検索のワークフローも設計されていて実用を考慮した素晴らしい設計だと感じました。すでに存在しているデータを利用してAIを活用するためにはどのドメインでも必要な機構となるため、汎用的に活用可能だと考えています。 -
P6-14 自己修正に基づく固有表現抽出モデルの指示学習
著者:高橋 拓誠, 谷口 友紀, 大熊 智子 (旭化成)
概要:固有表現抽出をLLMで解く際、抽出ミスがエンティティ、ラベルのどちらかの場合に自己修正によってエラーを抑制できることに着想を得て、固有表現抽出の指示学習に自己検証と自己修正を同時に学習する仕組みを考案し抽出精度を向上させた論文です。
感想:自己修正を追加することで回答が洗練されることは周知の事実かと思いますが、それを特定のタスクに適用する際に自己修正を前提として指示学習に組み込む手法は、Reasoningモデルの学習にも類似していて非常に理にかなっていると感じました。特定タスクにおける長期レンジでの推論が今後重要になってくると感じているためこのような手法をベースに発展していくのではないかと推察しています。
最後に
NLP2025でお会いし、議論や懇親させていただいた皆様、誠にありがとうございました!
松尾研究所では、各種ドメインへの自然言語処理・LLM技術を応用した共同開発プロジェクトを複数実施しています。
これらのプロジェクトは、最先端の技術開発だけでなく、実際の社会課題の解決に貢献することを目的としています。
今後も、企業や自治体、研究機関と連携しながら、自然言語処理・LLM技術の社会実装を積極的に進めて参ります。
松尾研究所では、カジュアル面談や各種イベントを通じて、プロジェクトにご興味のある方々と交流する機会を設けています。
もしもご興味をお持ちいただいた方は、ぜひお気軽にご連絡ください!
▼松尾研究所Xアカウント
▼カジュアル面談のお申込
それでは、次回のNLPでもお会いできますことを心より楽しみにしております。
Discussion