🐕

JSAI2024 視察報告

2024/08/01に公開

はじめに

SREホールディングス株式会社のデータサイエンティスト、北川です。
先々月、JSAI2024が開催されました。
今回は弊社の北川が現地視察してきましたので、会場および展示ブースの様子をご紹介します。

JSAI概要

開催概要

JSAIは、1年に1度国内の人工知能(AI)研究者が集う場であり、情報収集、情報発信、ネットワーク形成、採用・就職活動が行われます。画像などの特定の分野に限らず、幅広い分野の発表があります。

会期

会場の様子

JSAIには多くのセッションがあり、今回は30日と31日の2日間にわたり一般セッション、ポスターセッション、企業展示に参加しました。

一般セッション会場
一般セッションでは、募集した研究を口頭発表する場で、学生から研究者、企業の人まで様々な研究を聞くことができます。ホールで行われる場合もありましたが、写真のように仮設の場所を設けて発表が行われることもあり、セッションによっては立ち見になるほど賑わっていました。

ポスター展示
ポスターセッションでは、ポスター形式で密度の高い議論ができます。発表者と1対1で話すことができ、質問も多くすることができます。

企業展示
企業展示では、今年は約100社のブースがあり、企業におけるAIに関する活動を知ることができます。企業によってはエンジニアもおり、技術的な話もできました。

おことわり

  • 本稿は筆者の個人的な興味および学術的な関心を基に執筆されました。言及した論文の著者や企業との間に、当社との特別な関係は一切ありません。また、時間の制約により全てのセッションを網羅できなかったため、一部のセッションにのみ言及しておりますことをご了承ください。
  • 本稿での論文および講演に対する言及は、全て筆者の理解に基づいております。誤りがあった場合、その責任は全て筆者にありますので、どうかご指摘いただければ幸いです。

興味深かった発表、展示

特徴量の統計量およびクラスタリングを併用した画像異常検知

この論文は、画像異常検知の新手法を提案しています。PatchCorePaDiMの利点を組み合わせ、特徴量の統計量とクラスタリングを活用することで、より正確な異常検知を実現しています。
PatchCoreによる特徴量削減とK中心クラスタリング、PaDiMによるマハラノビス距離を用いた統計的特徴表現を組み合わせ、両者の異常スコアの加重平均を算出しています。これにより、計算時間の短縮と重要な特徴量の保持を両立しています。

画像構成内容の意味的解釈を反映した特徴ベクトルによる「かわいい」画像の分類方式

この論文は、「かわいい」画像を分類する新しい手法を提案しています。従来の色や形に基づく方法とは異なり、画像の意味的な特徴を重視しています。具体的には、日本語の言語データベースと学習済みCLIPモデルを使用して画像内のオブジェクトを認識し、その確率分布を特徴ベクトルとして表現します。この研究は、意味的な解釈を取り入れることで、従来の定量的な特徴よりも高精度な分類が可能となった点が印象的です。また、説明可能AIとしての可能性も示唆しており、今後の発展が期待されます。

列名と値の結合特徴量に基づいた列構成の異なるテーブルデータを処理可能な深層学習方式

この論文は、列がサンプル間で異なる表形式データを扱うための新しい深層学習手法を提案しています。従来の方法が列の同一性を前提としているのに対し、この手法は列名とカテゴリ値の両方から特徴を抽出し、融合させることで柔軟な対応を可能にします。この手法は、テーブルデータの分析に言語的な要素を取り入れる点が非常に魅力的です。Transformerのpositional encodingを活用することで、項目と値の関係性を捉え、異なる列を持つデータの有効活用が可能となるため、データの増加にも繋がります。従来の方法と比較して、深層学習の強力なアプローチを実感できる内容でした。

ブラックボックス大規模言語モデルにおける Hallucination 検知手法の検討

この論文は、大規模言語モデル (LLM) が事実から逸脱する「ハルシネーション」を検出する方法としてSelfCheckGPTを活用しています。SelfCheckGPTは、同じプロンプトに対する応答の類似性を評価し、LLMの理解度を測る手法です。この研究は、LLMのブラックボックス性を制御し、社会実装を進める上で重要な進展です。今後は、説明文の性能向上や他言語モデルとの比較が期待されます。LLMの特性を活かしたこのような研究は、実務において非常に有益だと感じました。

おわりに

今回のJSAI2024では、特に画像分野の異常検知やLLMの新たな活用法について多くの知見を得ることができました。LLMを中心とした自然言語処理や画像と自然言語のマルチモーダルに関する発表が多く、現在のトレンドを強く感じることができました。また、企業展示ブースではAIの最新動向や新製品について知り、現場のエンジニアと直接話す機会もあり、有意義な情報交換ができました。2日間という短い期間でしたが、多くの学びと新たなつながりを得ることができ、今後の業務に大いに役立てたいと思います。

SRE Holdings 株式会社

Discussion