Polaris.AI / JSAI2025 参加レポート
はじめに
2025 年 5 月 27〜30 日に大阪国際会議場で開かれた 第39回 人工知能学会全国大会(JSAI 2025) に、Polaris.AI は プラチナスポンサー として協賛し、初めてブースを出展しました。
この記事では ブースの様子 と メンバーが特に心に残ったセッション を、社内メモをもとに振り返ります。
プラチナスポンサーとして臨んだ初ブース
Polaris.AI は JSAI2025 にプラチナスポンサーとして参加しました。4 日間で多くの来場者の方々にブースに足を運んでいただき、研究者・企業エンジニア・学生の方々と、幅広く交流することができました。
また、直接対話するなかで、「LLM を現場でどう使うか」 というテーマへの関心が非常に高いと感じました。
セッションレポート 8 選
1. 探索が困難かつ状態行動空間が広大な問題を解くためのIMPALAとDemonstrationの併用 遊戯王 マスターデュエルでの適用事例
https://confit.atlas.jp/guide/event/jsai2025/subject/3R5-OS-31-02/advanced
- 遊戯王マスターデュエル (遊戯王のデジタルゲーム) のAIを強化学習する研究
- 遊戯王は行動パターンが天文学的に多い。そのため、よくある価値ベースの強化学習手法 (それぞれの局面の評価値を用いるような方法) では上手く学習が進まない
- そこで、方策ベースの手法を用いたが、学習初期において中々勝つことができず、学習が進まない問題がある。
- そこで、16 回に 1 回だけ人間のプレイログを混ぜて AI にヒントを与えた。
- また、遊戯王では1プレイに時間が掛かるので、効率良くリソースを使うために、既存の並列学習フレームワークであるIMPALAをベースとし、Actor×16・Learner×1 体制で学習した。
- ルールベースの既存 AI(COM、上級者クラスの強さ)に対し 勝率約50 % となった。
- 今後の課題として、COM対策のような動きとなってしまっている部分があるので、より汎用的・最適な動きをできるようにすることが挙げられていた。
- (感想)扱うテーマが面白く、人が沢山いて大盛況だった。
- (感想)人間のデモを使ってロボット制御など行動空間が広いタスクでも短時間で学習を進められるなど、他の分野にも応用できそうな手法だと思った。
2. メタ学習を用いた実店舗への来店者数予測
https://confit.atlas.jp/guide/event/jsai2025/subject/1D5-OS-24c-03/advanced
- 新店舗を対象に、客数の予測モデルを構築するという問題を扱う。新規出店店舗の来店者数は、過去の来店実績がない+立地の多様性があるため予測困難。
- 通常のやり方では、すべての店舗のデータを1つの関数にまとめて学習(=すべての店舗に共通する法則(関数)を1つ見つける)。
- 本研究では、①住宅地・市街地で傾向が異なる、②似たような立地にある店舗は来店者数が似た傾向などの仮説を置き、1店舗=1つの関数として扱い、「どういう特徴を持つ店舗は、どういう来店傾向になりやすいか」を学習(= 各店舗には、それぞれ独自の“来客パターン”(=関数) がある)。
- (Attentive) Neural Process=ガウス過程をニューラルネットワークにしたもの を手法として採用。
- 新規店舗は過去データがないため、予測の確信度が重要だが、その予測の幅をガウス過程で表現する。
- (感想)新しい店舗は新しいタスクとして捉えメタ学習を行っている点が非常に興味深い。実世界応用の良い例を見た。
3. マルチモーダルRAGを用いた交通事故リスク推定
https://confit.atlas.jp/guide/event/jsai2025/subject/4N2-GS-7-01/advanced
- 交通シーンの理解には高度なドメイン知識が必要だが、VLM(視覚言語モデル)単体ではそれをカバーしきれず、かつラベル付きデータの作成には高コストがかかるという課題がある。
- そこで、少量のアノテーションデータを活用し、RAG(Retrieval-Augmented Generation)を使って未見画像に対しても事故リスクを説明可能にする枠組みを構築するという研究。
- 交差点直進・左折時のリスク、リスク無し等、20件のアノテーションデータを使用。
- ベースラインモデルとしてGPT-4o(ゼロショット)を使用。提案手法ではCLIPとFaissで類似検索。
- 評価指標はBERTScore(言語類似性)とLLM-as-a-judge(LLMによる文脈評価、4点満点)。
- 結論として、精度は微増にとどまった。類似画像検索精度の限界。空間情報の埋め込みや検索手法の改善が必要とのこと。
- CLIPのような画像埋め込みでは、意味的特徴(何が写っているが、背景情報、状況推定)は捉えられるが、画像内のオブジェクトの配置や方位などの空間的関係性の表現が弱い(左右反転など)
- (感想) 実世界における空間的な詳細情報(物体の向きなど)が必要な処理は、画像埋め込みを用いて行うことに限界があることがわかったのは興味深かった。それを打破しうる技術としては何があるだろうか?VLMによる直接的な推論を用いることや、強化学習による死角の危険も良きできるモデルを学習するものなど種種あると思われ、今後のこの応用分野での発展に注目である。
4. ナレッジグラフの構築による専門知の構造化と評価
https://confit.atlas.jp/guide/event/jsai2025/subject/3P4-OS-46b-03/advanced
- 社内の技術文書を対象としたRAGの精度を上げる方法の研究。
- 社内標準書のような 階層化された短い節(3.2.1.4…)を含む技術文書は、従来のGraphRAGでは関係性を取りこぼしがち。
- そこで、章の構造をそのままノードとエッジにするGraphRAG-hierarchyを提案し、実際に社内文書で実験を行った。
- GraphRAG-hierarchyでは、ユーザーが検索したクエリから重要そうな単語を抽出し、それを含むノードとその子ノードを使用した。
- グラフデータベースとしてneo4jを用いた。
- 実験では以下のベースラインと比較した。
- GraphRAG: LangchainのLLMGraphTransformerを使ったもの
- Hybrid-RAG: GraphRAGで取得したチャンクとベクトル検索で取得したチャンクの両方を使う
- 実験結果: 提案手法GraphRAGよりも精度が高かったが、Hybrid-RAGには少し負けた。しかし、提案手法はHybrid-RAGに比べて平均1/10程度のコンテキスト長でほぼ同程度の精度を達成できた。
- (感想) 恐らく専門的で良質な技術文書が大量に存在しているであろうJAXAならではの研究だと思った。実験結果は大変参考になった。
- (感想) コンテキスト長が短くても精度が高かったということで、効率的な手法だと思った。コンテキスト長を増やし、兄弟ノード(前後の章)などを対象とするとさらに精度が上がるかもしれないなど、さらなる応用の可能性を感じた。
5. アバターと未来社会
https://confit.atlas.jp/guide/event/jsai2025/subject/2A2-PS-2-01/advanced
- LLMが意図から会話や動作を自動生成するアバターが登場。ロボットとAIが協働し、人口減少社会を支えるアバター共生社会が構想されている。
- 表情とジェスチャーを備えた人間型ヒューマノイドが最も直感的なインターフェース。
- 低価格ヒューマノイドとマルチモーダル解析の発展で高次認知機能の研究が可能に。
- 意図や意識をロボットに実装し、AIが社会参加する条件を探る構成的アプローチが深化している。
- しかし、全二重対話や人格設計など人間らしさの細部が依然として未解決課題として残っている。
- 2050年に身体・時間・空間の制約を超えるアバター共生社会の実現を目指す取組「MOONSHOT」が始動。遠隔医療や障がい者就労支援などの実証プロジェクトが成果を上げつつある。
- 大阪万博の石黒先生のパビリオンでは、アバター倫理と社会実装を来場者と共創する場を表現している。
- (感想)AI技術の進歩で機械(アバター)と人間の境界がどんどん狭まっていくことを感じた。
- (感想)今後アバターが登場したら、一人の協業者、共に働く仲間として接するマインドが大切になると思う。普段のAIとの対話やプロンプトでも心がけていきたい。
6. 実世界の友人がユーザの推薦受容に与える影響
https://confit.atlas.jp/guide/event/jsai2025/subject/2P5-OS-2b-01/tables?cryptoId=
- レコメンドはポジティブ・ネガティブ双方の影響を視野に入れ、人の行動心理を重視して研究されている。
- レコメンド研究の歴史は、情報フィルタリングから推薦アルゴリズム高度化、UX向上へと発展してきた。
- 説明可能推薦システムでは、Tagsplanation などを例に、評価値行列・知識グラフ・自然言語資源を用いて根拠を提示する手法が検討されている。
- 説明は心理学でいう「説得」に相当し、他人の行動提示が認知負荷を下げ消費者行動を変えることが実証されている。
- 実世界の友人情報を提示する実験では、推奨者の有無で受容度が向上し、特に親密な友人が薦めた場合に効果が大きいことが示された。
- 推奨者の専門性と親密度を指標化する著名なモデルOrganizational Trust Model に対応づけて説得力を分析する試みが行われている。
- 土方研究室では、社会的情報が推薦受容に与える影響や「過信」尺度、信頼形成プロセスの心理モデルを体系化。
- ドメインによって専門家の影響度が変化する可能性や、Fast/Slow意思決定への関与など今後の検証課題を提示した。
- AIの普及で推奨者が人からエージェントへ広がる中、親密度や信頼性が推薦受容にどう作用するかが重要な研究テーマとなっている。
- (感想)「信頼できる人の口コミ」がレコメンド受容の重要な意思決定となる、という直感的に感じていたことが理論化され興味深かった。
- (感想)自分自身がレコメンドを受容する際、どのような意思決定プロセスを辿っていたか考察すると関連が見えて面白い。
7. スポーツクライミングルートとクライマー動作の可視化:有向ネットワーク分析を用いたアプローチ
https://confit.atlas.jp/guide/event/jsai2025/subject/1Q4-GS-10-05/advanced
- ボルダリングが趣味なので、動作データがどのように可視化されるかが気になり、聴講。
- クライマーは自分の身体特性とルートを短時間で解析して最適動作を生み出すため、バイオメカニクスと運動学習が研究の焦点に。
- ホールドと壁に力学センサーを内蔵し、視覚化しにくい情報を直感的に提示する試みが進んでいる。
- 先行研究はミクロ視点(動作シーケンス比較)とマクロ視点(身体情報との関連サーベイ)に偏り、中間領域が不足。そのギャップを埋めるため、複雑ネットワーク解析で動作パターンとその変化を精密に捉えるアプローチが提示されている。
- 解析は「データ収集→ネットワーク構築→ネットワーク統計量抽出→多重回帰による登攀時間予測」の4ステップで行われている。
- クライミングトランジションネットワークではノードがホールド、リンクが四肢の移動を表し、自己ループの多さが高度なテクニックと体力消耗を示している。
- 主成分分析によりリンク数・自己ループ数の分散や手足統計の多様な相関が抽出され、登攀時間を予測するモデルが構築されている。
- 行列的アプローチは未着手だが、複雑ネットワーク分析を深化させればさらなる知見が得られる可能性が高いと示唆されている。
- (感想)グラフ解析でよくある行列的アプローチは未着手だが、複雑ネットワーク分析を深化させればさらなる知見が得られる可能性が高いと思った。
- (感想)ユニークな視点のアプローチで面白く、私自身のAI活用でも本研究のような発想ができるようになりたい。
8. AIの未来:研究室から実世界へ - 能動的学習が拓く次世代ブレイクスルー
https://confit.atlas.jp/guide/event/jsai2025/subject/2C4-KS-26-01/advanced
- 経歴: 発表者Shane Gu氏はトロント大学でジェフリー・ヒントン氏に師事。OpenAIに勤めた後、現在はGoogle DeepMindに在籍し、Gemini開発をリード。
- AIの3つの原力: 氏が考えるAIの原動力は「予測」「強化学習」「AIと人間の共進化」。
- 人間の思考を学ぶAI: 「AIと人間の共進化」に関して、トップ研究者や経営者など、卓越した人間の思考プロセスをAIが学ぶことで、AIはさらに進化すると指摘。
- AGIへの思想: キャリアを通じてAGI(汎用人工知能)の実現を一貫して追求。
- 「器用さ」こそAGIへの道: AlphaGoのような探索中心のAIよりも、オランウータンがハンモックを作るような「器用さ(Dexterity)」を実現するAIの方が、AGIには近いと考えている。
- 研究哲学: high "impact remaining / top talent density" なエリアを見つけて、研究対象とすべき。
- 未来予測: ここ数年で氏が驚いた技術は「Geminiの1Mロングコンテキスト」と「Gemini diffusion」のみで、他はすべて予測の範囲内だったと語る。
- 学習の3ステップ: AIの学習は「オフライン教師あり学習」→「オンライン教師あり学習(RLHFなど)」→「オンライン強化学習」のステップで進化していく。
- 日本への提言: 日本における生成AIの登場を「明治維新」に例え、日本は新しい世界に適応する下地があると今後の可能性に言及。
- 研究者へのメッセージ: 論文執筆に留まらず、その研究が社会にどのようなインパクトを与えるかまでを視野に入れるべきだと提言。
- (感想)AlphaGOよりロボットの器用さがAGIに近いという思想や、研究領域の選び方、今後の予測など、学びになる点が非常に多い素晴らしいセッションでした!
おわりに
今年の JSAI では 「生成AI をどう社会実装するか」 が最も熱い話題でした。
私たち Polaris.AI は、ブースでの対話やセッションから多くのヒントを得て、課題特定 → 要件定義 → PoC → 実装 → 品質保証 まで伴走できる強みを改めて確認しました。
今後も当社は、アカデミアとの連携を深めながら、最先端の人工知能技術の研究開発と実用化を推進し、日本のAI技術の発展に貢献してまいります。
※ 本記事は現地メモを再構成した速報レポートです。正確な数値や図表は公式予稿集をご参照ください。
おまけ
メンバーが大阪滞在中に食べた美味しいものの写真
Discussion