20241010 FULLY CONECTED
20241010 FULLY CONECTED
生成AIのイベント@日本橋三越の三越劇場
Wifiは?電源は?は。無いよ
私物のPCが良かった。iPhoneの充電が出来るから(ケーブル
WBの説明
Gemma ファインチューニングオンGoogleクラウド
Gemma2 for japan
生成AIと創薬 アステラス製薬
薬を探すステージ
ターゲットの特定
DNA mRNA タンパクシツ
漏れきゅらインテクレーション
大規模プロテインランゲージモデル
pLMs
モデルのトレーニング
一次元、二次元、三次元の化学式を生成
トヨタ、うーぶんしてぃ
ML内製開発への挑戦
0 1
課題1
実験管理
可視化
比較
共有
W&Bを知る
日本で初めての導入
可視化
自動でグラフ作成
比較
ワンクリック
共有
レポートで共有
生産性の向上
例 学習インフラの例
AWS採用。1/50になる
完遂出来ました
先進運転支援システム開発プロジェクト
データ収集規模の拡大
800倍以上に拡大
MLモデル数は10倍以上に
しかし、MLエンジニアは前と同じ数
トレサビリテー管理
リリースモデルの製造工程管理の失う
バリエーションが多すぎて工数がひっ迫
量子化、ファインチューニングなどでバージョンが莫大に
認識性能評価
評価を自動化。
今後
認知から判断へ
生成AIに採用
0.4秒子供の飛び出し検知が速くなる
画像生成AI stable.ai
アニメ制作への導入
背景をテキストとスケッチから作成
犬と少年 ネットフリックス
3D to 2D
3Dアニメーションを入力して、アニメ風の動画を作成
中割の自動生成
自動着色
ゲーム向け3D生成は始まったばかり
品質の向上
しかし
インディーゲーム、UGC
品質が良くても後処理(トポロジー、メッシュの修正、照明の修正が発生
それも自動化する研究開発
制御性、操作の向上が必要
オリンパスの事例
内視鏡AI構想
精密な治療
先進イメージング
付加価値ソリューション
信頼できる医療AI開発の課題
安心、安全、期待する効果
ポイント
仕様作成
データ管理
再現性
仕様作成の課題
開発者(否医療関係)は深い理解が難しい
複雑な言語化が必要
アノテーションの課題
がんの定義(色、形
経験、スキル、専門知識、ニーズのばらつき
リソース(データ、開発期間、コスt)が必要とする場合がある
PMなど否エンジニアはAI評価をすることが難しい
韓国におけるAIについて
あるふぁご(以後AI)
2023ウリアゲハ5000億円へ
4万アカウントへ
UpStage
ハレーション問題
解決策。顧客データをLLMに連結する
GPT4をチューニング
Friendliai
モデル、データ
デプロイシテサービスするのは別の問題
レイテンシを守りSLAを守るのは難しい
ChatBOTサービスのデプロイ
GPUコストが懸念
我々のサービス導入でGPUコストの削減が出来る
NextDayAIの事例
2倍から3倍
50%以上のGPUコストダウン
ふれんどりーコンテな
サイバーエージェントの事例
基盤モデル開発
極み予測シリーズ
マルチモーダル生成AI
クリエイティブを人間と同じように理解することが大事
理解、認識
日本語Clipの開発
クリエイティブとかのOCR
生成
マルチモーダルLLMの登場
データセットの作り方
会話(英語)を作成 ← 日本語に翻訳
なぜ、英語から生成してほにゃく
会話の質が良く多用しが高かった
日本語の利用は
表現が多用で会話の生成にハレーション
赤ん坊、あかちゃん、子供、小さい音の子など
認識能力向上を目指して
ナイーブ解像度、高解像度対応の必要性
正方形で学習されていることが多く、リサイズクロップ、ぱでぃんぐが必要
MiniCPM-V
画像を分割して入力する形式に
Qwen2VL
メルカリ、生成AI
生成AIがメルカリへの出品をサポートする
入力する項目が多く、また自由記入のため
これは売り手のUXの改善
書いてのUX改善
sigclip
Vector Database
レポート機能
人間がチェックするためにスプレッドシートにレポート作成
ファインチューニングで元画像に近い画像を返すようになった
あいまいな検索。わんぽーすは洋服ですか、漫画ですか
対策。パーソナリティレコメンドエンジン
WBのWeabeの使用
NTT生成Ai つずみ
tsuzumi
小さなLLMの
学習データの質と量を向上
日本語に強い
小型で軽量
チューニング
マルチモーダル
IOWNで小さなAIを連携する
GPUクラウドと学習データの分割(低遅延ネットワークの採用
フォーカスするマーケット
クローズとデータをセキュアに学習
メディカル、ソフトウェア
顧客サポート
コンタクトセンター、相談センター
メディカル
電子カルテとつずみ
構造化データ
カルテは自由記述欄が多く、構造化されていない
オンプレで自社に特化したLLMを構築したい
プライバシーと個人情報漏洩が怖いから
多言語サポートを開発中
スクラッチからの学習
モデルの観察、評価にWBを活用
自社での学習による治験と体力の蓄積を目指している
自然に矯正可能は汎用AIの思考エンジン
人の社会に自然に入り込めるAIをめざして
人に近いインターフェースを持ち、マルチモーダル
言語中心設計
非言語をLLMに接地させる
PDF図表も理解できるように拡張に取り組み中
データセットの公開
資格文章理解に関するデータセット
ダイアグラムの理解例
プレゼン資料(ポンチ絵の理解
伝票の理解
ロススパイクの抑制
Webや実世界でひとと共生するAIへ
sakana.ai
Discussion