🔬

データサイエンス勉強会第 1 回

2024/08/29に公開

データサイエンス勉強会第 1 回

はじめに

アイディオットのデータサイエンティスト、佐藤です。
今年 4 月に入社し、全社的なデータサイエンスリテラシーの向上のため、いきなりデータサイエンス勉強会を開くことになりました。
入社前からすり合わせはしていたのですが、このスピード感、まさしくベンチャーって感じですね笑
今回は 2024 年 4 月 23 日(火)に行った第 1 回の内容をお送りいたします。

概要

勉強会の目的

  1. 普段の業務で <span style="color: indianred; ">データがどう役に立つのか</span> を知る。
  2. データを主軸に置くアイディオットだからこそ、 <span style="color: indianred; ">データって何だろう?</span> を深める場を作る。

レベル感

統計検定 2 級程度。

目標

数式をなるべく使わず、図を多く用いてデータサイエンスのイメージを掴む。

背景

会社側

アイディオット側としては、データを扱う仕事であるにもかかわらず、データサイエンスの基本的知識が薄いため、業務で手こずっているとの情報をいただいていました。
ここにアプローチし、全員のレベルアップを図ろう、ということが今回の勉強会の発端になります。

データサイエンティスト側

一方、私たちのようなデータサイエンティストとしても課題感を感じていました。
それは、データに詳しくない方にわかりやすく伝えるにはどうしたらいいのか、という所です。
私なんかは、大学・大学院で「小学生でもわかるように説明しろ」と発表のたびに言われてきましたが、とはいえ、周りはある程度専門知識のある方ばかりのため、多少説明は専門的になっても大丈夫でした。
そこで、社内やお客様に対しての説明の練習をするために、今回の勉強会のような場を求めていました。
こうした両者のニーズがマッチしたため、今回のような勉強会の場を設けさせていただきました。

スケジュール

スケジュールは以下の全 6 回を予定しております。
月に 1 〜 2 回の頻度で行う予定です。
4 〜 6 回の内容は暫定的なため、今後変更があるかもしれません。<p>

自己紹介

そろそろ、「お前は何様やねん」と突っ込まれそうなので、ここで簡単に自己紹介します。
私は大学では、元々ガチガチの文系でしたが、色々あって地元の大学の心理学科に編入。
そこで統計学・データ解析に出会い、これを仕事にしたいと思うようになりました。
大学院ではニューロサイエンス(脳科学)で VR の研究を行い、1 社目では人工知能の研究開発で 20 年以上の実績がある老舗企業に入社。
以上のような経歴をたどり、データサイエンス・機械学習や深層学習の知見やスキルを深め、アイディオットに入社しました。

第 1 回の目的

  1. <span style="color: indianred; ">業務</span><span style="color: indianred; ">ビジネス</span> におけるデータのイメージを持つ
  2. <span style="color: indianred; ">データサイエンスは難しいものではない</span>、といったイメージを持つ
  3. データサイエンスにおける最も <span style="color: indianred; ">重要なポイント</span> を知る

ビジネス・業務におけるデータとは?

身の回りのデータ

突然ですが、みなさん、普段の生活や業務において、自分の身の回りにどんなデータがあるかイメージしていただけますか?

銀行の貯金額、毎月の支出、1 つのプロジェクトにかける工数…

色々思い浮かぶかと思いますが、これらがあることで、皆さんはあるメリットを受けていますよね?

貯金額や支出であれば、自分の金銭の管理ができる。
プロジェクトの工数であれば、そのプロジェクトの管理ができる。

そう、 <span style="color: indianred; ">データとはマネジメントするためのツール</span> なのです。

メーターとしてのデータ

ある有名な話として、データは車のメーターやナビに例えられます。
以下の図のように、車のメーターやナビが分からないと、今のスピードや自分がどこにいるか、どう進めばいいか、残りの燃料などわからないですよね?
まさしく事故を起こすために走っているようなものです。


一方、車のメーターやナビがわかれば、スピードや燃料、自分の現在地などがわかり、目的地に到着するまでに何キロのスピードで走ればいいか、いつ燃料を補給すればいいのか、などの目処を立てることもできます。
データは、 <span style="color: indianred; ">普段の生活や業務をマネジメントするためのツール</span> なのです。


データサイエンスの重要なポイント

データ分析の流れ

次に、データサイエンスの重要なポイントを、データ分析の流れに従って見ていきます。
データ分析の基本的な流れは、以下の 8 つのステップになります。


手前味噌で恐縮ですが、私の大学院生時代の研究を当てはめていきます。
私はちょうどコロナ禍が始まった 2020 年に大学院に進学し、リモートワークでの不安の増加や業務効率の低下といった課題に対し、VR による解決策を考案しました。
当然、この裏には VR で一儲けできないかと甘い目論見もありましたので、最終的にデモを作成し、ビジコンで発表したりしていました。
そのため、ビジネス的な考え方の例として取り上げられるかと思います。


さて、ここで『データ』と名前のつくものは『データ収集』と『データ解析』の 2 つになります。
データ分析、ひいては研究において重要なところはその前段階、 <span style="color: indianred; ">「課題」・「調査」・「仮説立案」・「目的」</span> になります。
ここの「合理性」・「社会的価値」・「新規性」の 3 つが揃わない限り、いくら面白そうな研究でも通りません。
これはビジネスでも同じことだと思います。

どんな対象がどんな課題を持っていて、その原因は何かをしっかり調査し、どんなソリューションや仮説が考えられるか、達成したいことは何か、

以上をはっきりさせない限り、ビジネスや普段の業務は先に進みません。


まとめ

第 1 回は、以下 3 点を目標にして内容を見てきました。
これまでの内容を振り返り、答えを下に加えて改めて整理します。

  1. 業務やビジネスにおけるデータのイメージを持つ 
    → データは普段の業務やビジネスを <span style="color: indianred; ">マネジメント</span> するためのツール
  2. データサイエンスは難しいものではない、といったイメージを持つ
    → データは周りにありふれたものであり、 <span style="color: indianred; ">データサイエンスは難しいものでない</span>
  3. データサイエンスにおける最も重要なポイントを知る
    → 重要なことは、プロジェクトの <span style="color: indianred; ">課題・目的・仮説</span>
    データサイエンスは <span style="color: indianred; ">手段</span>

次回

次回はデータの種類、ばらつきについてお伝えする予定です。
目標として、データの種類と様々なデータのばらつきについてイメージを持っていただくことです。

ここまでお読みいただき、ありがとうございました。

あとがき

AI・データ利活用をリードし、世界にインパクトを与えるプロダクトを開発しませんか?

アイディオットでは、今後の事業拡大及びプロダクト開発を担っていただけるエンジニアチームの強化を行っております。
さらに会社の成長を加速させるため、フロントエンドエンジニア、バックエンドエンジニア、インフラエンジニアのメンバーを募集しております!
日本を代表する企業様へ自社プロダクトを活用した、新規事業コンサルティング、開発にご興味のある方はお気軽にご連絡ください。

【リクルートページ】
https://aidiot.jp/recruit/
【募集ポジション一覧】
https://open.talentio.com/r/1/c/aidiot/homes/3925
【採用についてのお問合せ先】
株式会社アイディオット 採用担当:佐藤
メールアドレス:recruit@aidiot.jp

Discussion