👹

AIは人によるデータ分析を駆逐するのか?o1の登場からデータ分析の未来予想図を考える

2024/12/12に公開

ChatGPT o1 pro modeがリリースされまだ間もないですが、皆さんは体験されましたか?
僕はというと課金してます、$200。
データ分析者としてAIが敵となるか味方となるかまだままだわかりませんので、まずは相手を知ることから始めようというわけです。

そこで、LLMの登場からまことしやかに言われ続けてきた、データ分析がAIに淘汰される件についてですが、データ分析者としての考えを述べていきたいと思います。

https://x.com/TJO_datasci/status/1857728062936490313

こちら尊敬しているTJOさんがXでPostされていた内容ですが、僕としては激しく同意なわけで、もう少し僕の中で自分の言葉として言語化して用意してきたものをこの記事でつらつらと語っていきたいと思います。

AIは人によるデータ分析を駆逐するのか?

この問いに関してはYes and Noです。
まずはNoに関して触れます。

Noについて

実務におけるデータ分析はいつかの記事で触れた帰納的なものであって、必ず正解があるものではありません。
真実は一つだが解釈は無数」というのが実務世界のデータ分析です。もちろん無数にある解釈もほとんどはポジショントーク的なものだったり都合のいい解釈だったりします。
そのためにどれだけ確度の高い解釈を以ってして分析結果を意思決定に繋げるのか、というところが実務においてデータ分析が活躍する場だと思います。

また「データは嘘をつかないがデータを扱う人は嘘をつく」という言葉があるように、正しく取得したデータはもしかしたら真実を伝えてくれているけれども、人間が解釈してしまうと都合の良いように使えてしまうことへの警鐘があります。データに対する読み取り方解釈の仕方を学ぶ(統計学)ことによって嘘を嘘と見抜くことができるので、2chよろしく情弱として騙されないためにデータを分析することへのある程度のマナーを弁えていることが非常に大事になるわけです。

AIというのは(推論力がo1から備わっているとはいえ)与えられたデータでのみしか判断ができないわけです。
AIはその限られた情報の中から推論して分析をしてくれて、それらしいことを言いますが、それらしいことというのは誤った情報になりかねないのが現状です。(バイアスですね、与えられたデータ以外にも考慮すべき点が実務ではたくさんあって、たとえばどのようにデータが生成されているのかを知っていないとそれを考慮できない)
これらを以ってして判断をすることは非常にリスキーです。

そしてまだまだ必要とされるデータ人材として、AIが取って代わることのできない領域があります。
それは意思決定です。意思決定は人間がしないといけません。
責任が伴うものなので、それを支援するデータ分析には解釈性が必要です。
その解釈性は持っているデータのことをよく知り、その領域のことを専門家と同じくらいデータで理解していて、一緒に課題解決のために試行錯誤できる人しか生み出せません。

データ分析者として他のチームや組織から独立して与えられたデータでのみこねくり回す人にはまず不可能なことです。
霞ヶ関でパソコンをカタカタして法律や制度を整えている人には現場の苦しみや困りごとがわからない的な状況に似ている気もしますが。

僕が注意して今後のキャリアを考えていく上では上記を考慮しつつどのような人材になっていくのかを考えています。
たとえば

  • データ分析力 ✖️ ドメイン知識(マーケティングやProductを専門とする人が分析力をつける)
  • データ分析力 ✖️ 意思決定者(意思決定する人がデータ分析に精通すること)
  • データ分析力 ✖️ データエンジニアリング(分析も専門としつつデータ基盤やエンジニアリング力を持つ)
  • データ分析力 ✖️ アプリ開発などフルスタックエンジニア力(一騎当千力ですね)

一騎当千といえばこれ。本当に的を射ていると思います。
ここで言及されている一騎当千DSはデータ分析力 ✖️ ドメイン知識を持った課題解決者で、尚且つKPI達成KGIまでも達成してしまうような人かもしれません
IC(Individual Contiributor)が今後は求められる節は感じてます

https://x.com/TJO_datasci/status/1816071024364163214

どっちもどっちの中途半端になる場合はお勧めしません。あくまで実務においてデータ分析力はどの領域においても重要なことですから。

もちろんですが、データ分析力を極限まで伸ばしてそれだけで食っていくことも可能ですが、僕としてはそれは狭き門で本当につよい人たちと戦い続けなくてはいけません。
これは機械学習専門(Kaggler含む)然り、統計学者然りですが、彼らと競ってデータ分析力だけを鍛錬していくことは当然厳しい戦いになるわけです。

しかし、掛け算的な能力を持っていればAIとうまく付き合って自分のキャリアを広げていくことはもちろん可能になるので、駆逐されるどころか友好関係のまま付き合っていけるでしょう。

Yesについて

先ほどNoについて熱弁したにも関わらず、ほとんどのデータ分析者は駆逐されると思います。
どのような人たちかというと、業務の中でメインに

  • Excelで集計だけする人
  • pythonで機械学習ライブラリーそのまま当てはめてドヤる人
  • ちょっとだけSQL書ける人
  • 自己研鑽できない自称データサイエンティストの人
  • 言われたことだけやる作業的分析者

この辺りはもれなく消えていくでしょう。むしろ今の時点でほとんどの人が無価値に等しいかもしれません。
今は適切なデータモデリングがされていれば、それはつまり前提さえ正しければ結果も一意に定まる演繹的なものであるので、もはや自然言語でデータ探索が可能になっていきます。
このデータモデリングの考え方は今やdbtやLookerでSemantic Layerとして用意されていくのが流行りですし、そういう流れであるべきだと思います。
見え方はデータ民主化ですが、実際は中央集権的に統制された情報を民衆が触れているにすぎません。
このような状況では、単にBIツールやDWHから単純な集計をするような人たちはいらなくなるわけです。

「昨日の売り上げ教えて」

これだけで今もそうですが今後は結果が返ってくる時代になります。
そのような場合にはExcel集計だけしてる人、SQLかけてDWHからデータ集計できる人なんかは駆逐されます(というか、駆逐されるべきですね)

機械学習ライブラリーそのまま使ってドヤる人たちも駆逐されていくでしょう。
世の中結構こういう人たちは多くて、意外に幅を利かせています。
たとえばあまり技術に明るくない企業や、やや前時代的な企業にはキラキラITコンサルタントの人がいるわけですが、そんな感じです。
こいういう人たちもいずれは消えていくと思います。

また自己研鑽できない自称データサイエンティストも消えていくと思います。
具体的には基本的な技術力や技術への理解が乏しく担当している領域に対しての知識が圧倒的に足りない場合です。
そんな人いるわけがないだろうと思っていても意外にいます。
自分もそうならないように、と自分で自分を釘を刺す意味でもこういう人は駆逐されていくでしょう。

一定数もちろん人手という意味ですぐには駆逐はされません。
しかし、そうなればその会社に寄生するしか他なく、転職はできないし自分の価値(給料)を上げるための決断やその成果も得られなくなっていくでしょう。

https://x.com/100manbird/status/1840320864610382093

つまりはこれです。自分のキャリアでの競争もなく居心地の良さで居座り続けることで、結局のところコンフォートゾーンから抜け出せず、そして気づいた頃には転職もできない状態になっています。

そのようなデータ分析に関わる人たちは駆逐されていくので、Yesというわけです。

まとめ

これは自分への戒めのために書いている節もあるので、AI時代に対して危機感を持っている反面、今後の発展にとても興味があります。
AIの隆盛時代をデータ分析者として関わっていくことへの楽しみも持ちつつ、より自己研鑽へ邁進したいなと思う今日この頃でした。

Discussion