😆

「生成AIなんでも展示会」に出展してきたので振り返り

2024/04/23に公開

4/21(日)に開催された生成AIなんでも展示会に「高解像度画像が入力可能な日本語LVLM」という展示内容で出展者として参加してきました。

こういうイベントに出展者として参加するのは初めてでしたので、今後イベントに初出展される方の役に立てばと思い振り返り記事を書こうと思いました。

出展準備

出展内容決め

出展申込みはしたものの出展内容が決まるまで私はかなり時間がかかりました。

申し込み当初からVision Language Model(VLM)系で展示したいなという思いはありました。

最初はマリオをVLMでプレイさせる的なアプリを作りたいなと考えていたのですが、準備を先延ばしにするにつれて学習データを作成する時間がなくなりその案はボツになりました。

最終的に論文を読んでいたら画像の解像度を高めに入力したら、良い性能の日本語出力可能なVLMが作成できそうだなと思い、LLaVAの翻訳データが公開されていたのも相まって「高解像度画像が入力可能な日本語LVLM」で行こうと決めました。

内容が決まったのはイベントの10日ほど前でした。

出展物作成

学習コード自体はすでに自身でVLMを学習させたときに公開していたコードがほぼ流用できそうでしたので、高解像度入力の部分だけ新しくできるように調整するだけでした。そのためコードを書く作業は1日ほどで終わりました。

メインのモデルの学習は4日ほどで終わったのですが、ここで何を血迷ったのかどうせベンチマーク回すなら同じ学習データかつ同じベースモデルで高解像度入力なしのものと比較したいと思ってしまいました。

新たなモデルの学習にさらに3日ほどかかり、このモデルの学習が終わった時点でイベント前日の17時ぐらいでした。

最後に資料の準備をする必要があり、モデルの学習中に資料の準備を少しずつ進めていたのですが、ほとんどがモデルの学習が終わらないと書けない内容となっていたため急いでベンチマークを回して資料を埋めていきました。

このときばかりは自分のモデルは軽量で動作速度も早いはずなのにもっと早く動けと思ったりしていました…。

最終的になんやかんやで公開するコードの整理等をしていたら準備が終わったのがイベント当日の午前2時過ぎでした。

イベント用の持ち物準備

モデルを学習させていて暇なときにイベント用の持ち物について調べたりしていました。

何が必要か全然分かっていませんでしたので、出展者用のDiscordで皆さんが書かれている内容やコミケ等の参加記事を参考に以下のものを用意しました。

  • テーブルクロス
  • ポップスタンド ×2
  • 両面テープ
  • はさみ
  • マジック
  • ネームプレート入れ
  • ラップトップ

出展当日

展示準備

当日は会場が行きなれていない渋谷だったのもあり道に迷いましたが、早めに家を出ていたため一般開場の1時間半ほど前に会場入りして準備を始めることができました。

私の展示は複雑なハードウェアがあるわけではなかったので、準備後は他の参加者の方々とお話する時間もとることができて楽しかったです。

イベント開始

イベントは14:00〜18:00だったのですが、開場後すぐにたくさんの人が来てかなり驚きました。

イベント開始前は有名出展者とかではないので、休憩挟みながら説明できるかなとか思っていたのですが甘かったです。

イベントが開始すると14:00〜18:00まで人がたえず約4時間説明し続けることになりました。

疲れはしましたが、参加者の方々の生成AIへの興味が高いのが分かったり、有益な情報をいただけたりと終了後は展示枠で参加して良かったなと思えました!

イベント終了後

イベント前に見ることができていなかった他の出展者の展示を見せていただける時間があったので、色々と見学させていただきました。

運営の方のこういった配慮もあり本当に素晴らしいイベントでした。

参加して良かった点

今回イベントに参加して個人的に良かったと感じた点は以下のとおりです。

  • ローカルでここまで動くのすごいと言っていただけて、今後の開発のモチベーションが上がった。
  • モデルの構造やベンチマークの解析についてアドバイスをいただいたり、意見交換をすることができた。
  • 職業によって生成AIの活用の方法が色々あるということを知ることができた。
  • VLMの応用方法について議論することができた。
  • 他の展示者の方々と交流することで自分が詳しくない画像生成や音声関係等の技術について知ることができた。
  • 生成AIに関わっている人なら誰もが知っているような有名人とお話することができた。

反省点

イベントはとても楽しかったのですが、準備から出展を通して以下のような反省点もありました。

  • コミュ症がでてしまいXで一方的に知っているような運営の方や展示者の方に話しかけに行くことができなかった。せっかくの機会なのにもったいないことをした。
  • 名刺の準備ができていなかったため、名刺を頂いた方々にXやGithubのアカウントを教えることしかできなく申し訳なかった。また、名刺があったほうが交流しやすいと感じた。
  • イベント会場にディスプレイを持っていかなかったこと。説明中常に机の前に立つような状況になり、展示を見にくいと感じた方がいたかも…。
  • 展示デモのGUIの文字の大きさが小さかったこと。遠目で見る人の視点に立てていなかった。
  • 余裕を持って出展準備するべきだった。(これは何回参加してもいい続けていそう)

最後に

このような楽しいイベントの場を提供してくださった運営の皆さん本当にありがとうございました。

また交流してくださった展示枠の皆さまや展示を見に来てくださった皆さまもありがとうございました。

第2回がもしあるようでしたらまた参加したいなと思いました。

展示したモデルは以下からダウンロードできますのでぜひ遊んでみてください。
https://huggingface.co/toshi456/llava-jp-1.3b-v1.1

技術の詳細については別途記事を書きたいと思います。

Discussion