Open13

読書 - AI・データ分析プロジェクトのすべて

hyamakawhyamakaw

Next Action
AI・データ分析業界はこの数年で変化が激しい分野であったことがわかります。技術動向によって、仕事内容や求められるスキルも変化することを覚えておきましょう。

AI業界は変化が激しい。求められるスキルも日々変わる。
この本が発刊されたのは、生成AIブーム以前だった。10年後がどうなるか誰にもわからない。

hyamakawhyamakaw

中国は10億人がひしめく魅力的な市場だが、法規制による外国企業の参入が制限されている。
自国のサービスが発展する大きな要因となっている。

BATH(Baidu, Alibaba, Tencent, Huawei)
主力事業はGAFAの各企業とだいたい一緒
G B : 検索エンジン
A A : EC
F T : SNS
A H : Hardware
※ GAFAの2番目のAはAppleなので、厳密には異なる

hyamakawhyamakaw

Next Action
世界と日本のIT企業の状況をおおまかに把握できたと思います。技術情報やデータ分析の動向を追うときは、日本だけでなく、アメリカや中国の情報もチェックしましょう。

意識的に英語で調べる。
英語文献が圧倒的に多い。日本語でヒットしない情報も、英語だとすぐに見つかることも多い。分野によっては中国語で検索するのもありかも。

hyamakawhyamakaw

Next Action
AIシステムの開発と従来のシステム開発との違いを理解しましょう。AIシステムを開発するときに、データや契約の違いと合わせて、とくに「精度」を考える部分がどこなのか考えておきましょう。

従来のシステム開発は「ウォータフォール型」、AIシステムの開発は「アジャイル型」がよく使われると書いていた。最近はシステム開発でもアジャイルが主流だと思う。
AIシステムは精度を担保し続ける必要がある。請負でなく準委託契約を結び、AIシステムの導入後も継続的に精度を改善し続けるパターンが多い。

期待値コントロールがとても大事

hyamakawhyamakaw

AIの導入を検討する前に、解決すべき課題を明確にする。
これはビジネス全般に当てはまる。課題は具体的であるほど計画も立てやすい。

47PではAIシステムの開発をテーマとしているので、実稼働性に要点が置かれている。
データ分析関連ではアドホック分析も案件としてあるので、何でもかんでも実稼働性を意識する必要がある訳ではないと思う。

hyamakawhyamakaw

Next Action
AI導入が適切かどうかやPoC実行時における注意点を解説しました。運用するAIシステムを想定して、どのような「検証」が必要なのか考えてみましょう。

  • データを取得し続けられるか
  • 精度を担保し続けられるか
  • そもそもAIシステムが本当に必要か?
  • AIシステム以外の解決策がないか?

PoCの期間が長引きすぎるのもよくない。
ビジネスインパクトを最大化する観点が必要

hyamakawhyamakaw

Next Action
それぞれのベン図の領域において、自身の経験や専門領域をふまえ、やりたいこと、やれること、やるべきことをきちんと整理・把握し、自分の方向性を決めましょう。

最終的なキャリア目標を描けていないので、直近1, 2年でやりたいことをまとめた

やりたいこと やれること やるべきこと
ビジネス ・課題解決 ・Tableau
・プレゼン
・ビジネスの理解
・主体的になる
サイエンス ・論文を元にモデル構築
・kaggleメダル獲得
・Pandas, Matplotlib
・簡単なモデル構築
・統計の理解
・深層学習に親しむ
エンジニアリング ・開発サービスのETLを改善
・ポートフォリオ作成
・NoSQL
・Oozie
・Airflowの理解
・BigQueryの理解
hyamakawhyamakaw

Next Action
データサイエンティストのキャリアから、より専門的で高い価値を発揮するためにはデータサイエンスを軸として、どういう強みを持ち合わせた人材を目指すかの戦略が必要です。そのゴールから逆算し、業務経験や仕事などを主体的に選択してください。

はじめからキャリアの終着点を描くのは難しい。データサイエンス分野で必要なスキルセットは、データサイエンティスト協会から公開されている。まずは比較的習得しやすいスキルから獲得し、適性や興味関心が分かってきた段階で決めても良いのでは?
https://www.datascientist.or.jp/news/n-pressrelease/post-1757/

hyamakawhyamakaw

データサイエンティストに求められる「データビジネス力」はPMと相性が良い。PMは課題設計や、顧客とのヒアリングを通して定性分析を行う場合がある。データビジネス力が役立ちそう。

hyamakawhyamakaw

Next Action
データサイエンティスト市場は、以前に比べて売り手市場とは言えません。将来のキャリアパスを見すえて、どのような環境で働くのがよいか考えてみましょう。

分析ツール開発会社、事業会社、受託分析会社に大別されていた。
分析ツール開発会社は、ソフトウェア開発寄りのイメージがあるので、そもそもデータサイエンティストの募集枠が少ないかも?

事業会社のサイエンティストといっても、研究開発寄りなのか、データエンジニア寄りなのか、部署横断のアナリストとして働くのかなど、選択肢はたくさんある。一括りにはできない。

受託分析会社はコミュニケーションスキルを初めとするデータビジネス力が強く求められるイメージがある。キャリア設計においてビジネスを重視するのであれば、良い選択肢だと思う。

直近では3つのスキルを程よく伸ばしたい。大企業ほど分業化が進んでいるイメージがあるので、ベンチャーの方が満遍なく関われそう。ただ実際に就職先を選ぶ際には、ワークライフバランスや、ミッション・バリューなどスキルセット以外の面も考慮する必要はある。

hyamakawhyamakaw

Next Action
募集要項でわかることは、待遇だけではありません。福利厚生や組織体制などを考慮する必要があります。身近にある求人情報から、その企業がどんな人材を探しているのか推測してみましょう。

企業によってはデータサイエンティストを広義の意味で使っている場合もある。
例えば

  • 機械学習エンジニア
  • データアナリスト
  • BIエンジニア
  • データエンジニア

などの業務に近い可能性がある。認識合わせが必要。

データアナリストはビジネス力が高く、データサイエンティストはデータサイエンス力が高いというイメージがある。