🐈

生成AI時代のデータサイエンティストのキャリアについて考える

に公開

はじめに

昨今の生成AIの進化が目まぐるしく、今後のキャリアをどうすべきかぼんやり悩んだり、内心焦っている人は多いのではないでしょうか。私もそのうちの一人です。
本記事では、私の頭の中の整理も含めて、生成AI時代のデータサイエンティスト(以下、DS)のキャリアについて考えてみます。

機械学習/データ分析の専門家だったはずが、プロンプト/RAGエンジニアに

ここ数年まで企業内の「機械学習案件」は、需要予測モデルやレコメンドエンジンなど、従来型のMLプロジェクトが中心でした。しかし2023年以降、そうした案件はひと段落し、代わるように生成AIプロジェクトが急増しています。
その結果、元々MLプロジェクトを担当していたDSが生成AIプロジェクトにアサインされることは多いのではないでしょうか。そしてその内容は、社内ナレッジを要約するChatbotプロジェクトのようなものではないでしょうか。
そして思うはずです、「あれ、APIを叩いてプロンプト書いているだけで、モデル構築とか全くやってなくね?本当にこれでいいのか...?」と。

AI‑Agentブームとスキルセットのギャップ

Chatbotプロジェクトをやっているうちに、世間ではAI-Agentが流行し始めました。
機械学習とAIの専門家であるDSなのでもちろん興味があると思いますし、積極的に学んでいる人も多いと思います。しかし、学んでいるうちに気付いてきます。「あれ、AI-Agent開発で必要なスキルセットってデータサイエンティストのスキルセットではなくて、ソフトウェアエンジニアのスキルセットでは?」「今のままだと、全然スキル足りなくね?」と。

今までのMLプロジェクトではプロジェクトによって多少異なるものの、以下のようなメンバー構成でそれぞれ役割があったかと思います。

図1.MLプロジェクトのチーム構成

一方、AI-Agent開発のチーム構成は以下のようになるのではないでしょうか。

図2.AI-Agentプロジェクトのチーム構成

もちろんDSにも「評価・検証」という強みがあります。具体的には、

  • LLM 評価指標設計
  • RAGの検証
  • 安全性・ハルシネーション検査
  • オンラインA/Bテスト設計

――といったタスクは残るものの、役割が狭まる懸念も否めません。

本当に必要なMLプロジェクトは残り続ける

生成AIブームで“なんとなく始めたPoC”は淘汰されつつありますが、ビジネスに直結するコアMLプロジェクトまで消えるわけではありません。

  • 製造業の不良品検知モデル
  • 需要変動が激しい物流最適化
  • 医療系の画像検知
  • 自動運転

など、高度なモデリングと専門知識が不可欠な領域は依然としてDSの腕の見せ所です。とはいえ、案件総数が減る中で競争は激化します。

どういうキャリアを考えるべきか


図3.DSに求められるスキルセット(出典:一般社団法人データサイエンティスト協会

上図はデータサイエンティスト協会が定めたスキルセットです。しかし、実際はすべてを一人で極められるドラクエの主人公のように“万能”になるのは現実的ではなく、チームでの役割分担が前提になります。(こんなの一人で全部できる人、見たことない)
一方で上記で述べたように、生成AIプロジェクトではDSの役割が限られるため、どれか1つできればよいのではなく、今まで以上にやれることの幅を広げる必要があると考えています。
以下では、3つのポジションを提案します。

ビジネス特化DS

「ビジネス力」「データサイエンス力」に特化したDSです。
既存のPMの仕事を巻き取りつつ、モデル構築/データ分析も行います。
具体的には以下のようなタスクが想定されます。

  • 事業課題を生成AI/MLのフレームに落とし込み、ROIを設計
  • ユーザーストーリを描き、プロンプト設計・評価観点を事業部などに提示
  • AIガバナンス/法規制リスクを経営層と議論し、意思決定を支援
  • MLモデルを開発し、エンジニアに連携

エンジニア特化DS

「エンジニア力」「データサイエンス力」に特化したDSです。
ML(LLM)エンジニアという呼び方をするかもしれません。
既存のMLOpsエンジニアやバックエンドエンジニアなどの仕事も行います。
具体的には以下のようなタスクが想定されます。

  • MLモデルを開発
  • 推論インフラ(API)の構築
  • 監視/評価用ダッシュボードの構築
  • セキュリティ&ガバナンスの整備

LLM特化DS

「データサイエンス力」に突き抜けたDSです。
既存のMLモデル開発はもちろん、他社が開発したLLM APIを利用するにとどまらないモデル開発を行います。
具体的には以下のようなタスクが想定されます。

  • 独自LLMの設計・学習を実施
  • 安全性やハルシネーション抑制を検証
  • RAG/Agent 統合を設計し、性能・コスト最適な推論フローを構築

まとめ

生成AIの台頭によって、従来のデータサイエンティストの業務の幅が広がることが考えられます。
本記事では広がった先として、ビジネス特化DS、エンジニア特化DS、LLM特化DSという3つのポジションを提案しました。
今後、生成AIがどれほどまで進化するかは見当もつきませんが、生成AI時代のキャリアについてはそろそろ考えたほうが良いかもしれません。

Discussion