🎓

新人データアナリストの学び【01】

2024/11/15に公開

自分の経歴

8月1日に自分は4月からインターンしている会社に社員としてジョインしました!忙しく毎日を過ごしていく日々が続いて早3ヶ月。データアナリストとしての日はまだ浅いですが、今回は新人データアナリストとして入社した自分の最近の学びをまとめたいと思います。

データ分析の結果は絶対的な真実ではない

初めてチームリーダーに自分の分析を持っていた時に「なんで〇〇じゃなくて△△にしたの?」と聞かれました。なんで?うーん、、、なんでと言えば直感的にそっちの方がデータがいい感じだと思ったから。ディベート部出身の私にはありえないほどふわっとした回答しか出てきませんでした。

そこで初めてデータ分析をしているということは、常に何かしらの決断を下しているということに気付きました。改めて振り返って見ると当たり前のことです。データ分析には正解が複数存在する。つまり、道中で分析官が選んでいる道のパターンが複数ある。分析官は選んでるんです!だからフィールドがオープンで面白い!

選ぶという行為には責任が発生します。なぜ〇ではなく△を選んだのか説明する責任があるんです。もちろん全ての可能性を潰すことは人間として不可能です。自分の視野の外にある選択肢もあるかもしれない。でも自分のできる範囲でしっかりとしたロジックを持って分析報告に望まないと、納得してもらえない可能性が高い。

とてもシンプルなことですが、自分にとってはとても大きな学びでした。わかったところですぐ実践できるわけではないのですが、、、意識しているだけで少しは成長しているのかなと思っています。

データ分析の目的を常に意識する

データの中に踏み込めば踏み込むほど、全体像がわからなくなってきてしまうことに気付きました(あくまでも、自分は)。これが出てきて、あれがどうなってみたいなのを追い続けるとだんだん「あれ、これってなんのための分析だっけ?」ってなりました。

幸い、初めてのプロジェクトなので師匠が上手くガイドしてくれて迷子にならずに済みましたが、自分でも全体像を見失わないように努力が必要だと感じました。そもそもの目的を意識しないと、次のアクションに困ることもあったので、ここは改善していきたい点ですね。

報告会の目的

自分の中で報告会は「こういうデータが出ました、どうします?」の会だと思っていました。なので自分の意見を特に持たないで分析結果を共有していたんですが、どうしてもふわふわしてしまって、あまり良くないと思いました。それを師匠に相談したところ、実際は「分析の結論は〇〇です。理由はXYZだからです。」の会だと言われてすごくしっくり来ました。

これは目的を意識することとも繋がりますが、分析には何かしらのゴールがあり、そこに辿り着くためのストーリーもあるわけです。「そのストーリーをこの分析でどうサポートできるか?」を考えて結果を報告すると受け取る側もわかりやすいし、説明するのも楽になると思います。(これは本当に学んだばっかなので、実践することはできてないですが、、、頑張ります!)

おまけ:テクニカルな学び

変数を比較する時は「小さい<大きい」

師匠が言うには、コードレビューをする際にわかりやすいとのこと。実際書いてみると少し面倒なものの、後から見返すときにわかりやすかった!

# こっちではなく
if (b > a):
	return b

# こっちをやる
if (a < b):
	return b

master~と言う変数名は避けた方がいい

本当の意味でのマスタ以外には使わない方がいい。なんか気づいたら master_df, master_df_alpha, master_df_alpha_beta とか何かとマスタが増えてた事件がありまして、、、それは避けようって話ですね。

決定木(分類&回帰)

レクチャーで見たことはあったものの、実際に作ったことはなかったのでとても勉強になりました。ここら辺まで来ると、やっぱり日本語のボキャブラリーを増やさなきゃって思ってます。回帰は英語では知っていたものの、日本語だと??ってなったので、、、分析官としてのスキルアップと同時に言語のレベルも上げなければ。

まとめ

学びを振り返ってまとめるのって本当に大事だなって思います。振り返ることで次どう動くか、どれだけ進歩したか、などが見えます。それをまとめると言う作業をすることでその学びを定着させることができる気がします。

GitHubで編集を提案

Discussion