📚

松尾研究所のデータサイエンティストが今年の業務に役立ったと思う本10選

2024/12/05に公開

こんにちは、株式会社松尾研究所シニアデータサイエンティストの浮田です。本記事は、松尾研究所 Advent Calendar 2024の記事です。

私は今年、業務周辺のビジネス書や技術書を読むのに時間を割くよう心がけてきました。これはビジネススキルにしろ技術にしろ、業務ドリブンに都度調べるだけでは習得できるスキルに限界があり、しっかりと本を読んで体系的に学ぶことも大事だと思っているためです。そこで今回は、私が今年の松尾研究所で業務をする中で、何かしら業務の役に立ったことがある本を紹介したいと思います。

この記事では、まず私の松尾研究所での業務内容について簡単に記した後に、「仕事の進め方」「チームマネジメント」「クライアントワーク」「機械学習」「エンジニアリング」の5カテゴリに分けて紹介していこうと思います。

私の業務について

  • 松尾研究所では、1) 様々な企業様とのAIの共同開発、2) 社内プロジェクト推進の2点がメインの業務です
  • 共同開発では、データサイエンスチームのマネジメントやクライアントワークを行っています。AI開発のプロジェクトマネージャーとして、メンバー複数名のマネジメントや、企業様とのスコープ調整や報告を行っています

より詳細なバックグラウンドはこちらです。
https://zenn.dev/mkj/articles/1c704d852bf26f

仕事の進め方で役立っている本

リーン・スタートアップ

https://bookplus.nikkei.com/atcl/catalog/12/P48970/

タイトルには「スタートアップ」とありますが本文中にも書かれている通り、様々な仕事に役立つ内容だと思っています。「構築→計測→学習」のフィードバックループを高速に何度も回すという仕事の進め方、特に何事でも小さくスタートして1つ1つの仮説を検証していくという進め方は、社内プロジェクトでもクライアントワークでもできる限り取り入れています。

チームマネジメントで役立っている本

エンジニアリングマネージャーのしごと

https://www.oreilly.co.jp/books/9784873119946/

データサイエンスチームのマネジメントに関する本は、現時点ではまだ少ないと思っています。そこで、近い業務である、エンジニアリングマネージャーの業務に関する本を参考にするようにしています[1]。この本では1on1の方法や権限委譲の方法、さらには入社最初の1週間の過ごし方 (オンボーディング) など、データサイエンスチームのマネジメントにも直結する内容が幅広く書かれています。私の業務でも、特にオンボーディングや1on1の方法に関してこの本の内容を取り入れました。

エンジニアのためのマネジメントキャリアパス

https://www.oreilly.co.jp/books/9784873118482/

こちらもエンジニアリングマネージャー向けの本です。特に1on1の方法に関して、いくつかのパターンが例示されており、普段の1on1を進める際に取り入れています。

HIGH OUTPUT MANAGEMENT

https://bookplus.nikkei.com/atcl/catalog/17/P55010/

マネジメントの有名な本ですが、データサイエンスチームのマネジメントでも役に立つ本だと思います。そもそもマネージャーとは何をする仕事か、マネージャーのアウトプットとは何かなど、マネジメントをする上で心得ておくことが満載です。定期的に読み直したり、困った時にこの本を振り返ったりと、何度も見返しています。

クライアントワークで役立っている本

外資系コンサルが教えるプロジェクトマネジメント

https://www.daiwashobo.co.jp/book/b10031344.html

プロジェクトマネジメントについてはPMBOKを体系的に学習するのも良いですが、個人的にはこの本が非常に役立っています。プロジェクト開始時に気をつけることやクライアントワークの上手な進め方など、業務で実践的に使える「べき・べからず」のTipsが多く書かれており、適宜読み直しています。

Google流資料作成術

https://www.njg.co.jp/book/9784534054722/

スライドのメッセージの伝え方、色の使い方、適切なグラフの選び方など、スライドの作り方に関する本です。良いスライド例と悪いスライド例の比較も多いです。普段の業務でスライドを作成する際に、この本で紹介されているスライド作成方法を取り入れています。

機械学習で役立っている本

Kaggleで勝つデータ分析の技術

https://gihyo.jp/book/2019/978-4-297-10843-4

テーブルデータの解析に関して、基本的な手法から高度なテクニックまで幅広く掲載されています。基本的な特徴量エンジニアリングや学習の方法を再確認する時から、複雑なモデルを作る時まで、この本を参照することが多いです。実際にこの本で紹介されているテクニックを業務で使用したこともあります。

Kaggleに挑む深層学習プログラミングの極意

https://www.kspub.co.jp/book/detail/5305133.html

こちらは画像や自然言語のデータの解析に関する本です。単純な画像認識でも知らなかったテクニックが載っており、モデルの学習に取り入れたことがありました。また画像検索や自然言語処理の特徴量生成などについても実例ベースで詳しく書かれており、今後これらのデータを扱う際には参考になりそうです。

現場で使える!機械学習システム構築実践ガイド

https://www.shoeisha.co.jp/book/detail/9784798179049

この本ではモデルの学習方法についてだけでなく、プロジェクトチームの作り方や、データの収集方法、学習済モデルの提供方法などについても紹介されています。また需要予測など実務に近い課題を扱っていることから、業務によっては直接使える可能性もあります。私も業務でAIシステムを構築する際に、この本での実例を元にアーキテクチャを考えることがありました。

エンジニアリングで役立っている本

Googleのソフトウェアエンジニアリング

https://www.oreilly.co.jp/books/9784873119656/

ソフトウェアエンジニアリング一般についての本ですが、データサイエンティストにとっても有用な本かと思います。例えば1章の「ソフトウェアエンジニアリングとは何か」という章にはプログラミングとソフトウェアエンジニアリングの違いが述べられており、業務でも「今のコードはどこまで作り込むべきか、保守性が必要か」を考えるようになりました。他にもテストのあり方など、一度読んでおいて損はない本だと思っています。

まとめ

以上「今年の業務で役立ったと感じている本」を紹介しました。読者の皆様に役に立てば幸いですし、「自分はこの本が業務の役にたった」という本があれば是非教えていただきたいです。

脚注
  1. このあたりは会社によって業務の分担は違うかもしれません。最近のこちらの記事ではエンジニアリングマネージャーとプロジェクトマネージャーの分担について述べられていますが、弊社においてはあまり区別がないように思います ↩︎

松尾研究所テックブログ

Discussion