📖

社内勉強会でオライリー本を3週間で読破する方法 - 爆速データエンジニアリングドメインディープダイブ

2024/06/17に公開

こんにちは。Acompany 新卒のハルカです。

Acompany のプロダクトの 1 つに Data Clean Room があり、それらを利用するデータエンジニアとデータエンジニアリングに対する理解は非常に重要です。そこで、データエンジニアリングにドメインディープダイブするために社内勉強会を開催しました。

今回は、以下の 2 点に関して紹介します。

  • どのようにデータエンジニアリング勉強会を開催し、短期間でドメインディープダイブを行ったか
  • どのような資料をデータエンジニアリングの勉強で使ったか

特に、エンジニアとして時間の確保が難しい中、限られた時間と期間(1 回 1 時間枠で 3 週間)で、私達がどのように勉強会を行ったかを重点的に紹介します。

データエンジニアリング勉強会の内容

今回の勉強会は以下の内容で行いました。

  1. 「データエンジニアリングの基礎」勉強会
  2. 「データマネジメント」勉強会
  3. 「データ志向アプリケーションデザイン」勉強会

1. 「データエンジニアリングの基礎」勉強会

まず、初めにオライリーの「データエンジニアリングの基礎」から始めました。
この本は、データエンジニアリングの基礎を網羅しているため、データエンジニアリング初心者におすすめです。また、データエンジニアリングの基礎を学ぶことで、データエンジニアリングの全体像を把握することができます。
https://www.oreilly.co.jp//books/9784814400652/

この本は 11 章あるので、ほとんど毎日 1 時間枠の勉強会を行い、1 章ずつ進めて約 3 週間で読み終えました。また、参加できなかった人のために、録画を残して共有しました。

第 1 ~ 3 章(回): 要約 + 発表

時間配分は、発表: 30 分/質疑応答・感想戦: 30 分です。
最初の 3 回は私が 1 人で担当し、要約した資料を Notion にまとめて共有して発表するいわゆる一般的な輪講のスタイルです。

良かった点

  • 資料の品質は比較的高いと評価をもらえた
  • 1人が作成した資料なので一貫性があり、録画ビデオと資料を合わせたときに追いかけやすい

悪かった点

  • 1 章あたり 40~50 ページあるため、資料の量が多くなり、感想戦の時間を削ることがあった
  • 感想戦が削られることにより、自分の認識が薄い部分は補完されなかった

第 4 ~ 6 章(回): Active Book Dialogue + コメント

次に、第 3 回 までの反省を踏まえ、Active Book Dialogue という形式で進めました。

Active Book Dialogue とは

Active Book Dialogue (ABD)は、1 冊の本を複数人で分担読書し、要約と対話を通して理解を深める新しい読書法。事前準備不要で誰でも参加でき、アウトプット力強化や新たな気づきが得られるのが特徴。

はじめに、私が該当の章をざっと読んで分量を把握し、参加者の人数で節ごとに分割しました。その後、各自が分担した節を読み、要約を行いました。そして、他の人の要約を読んでコメントを付けてもらい、それを元に感想戦を行いました。

時間配分は以下の通りです。

  • 黙読・要約: 40 分
  • コメント: 10 分
  • 質疑応答・感想戦: 10 分

良かった点

  • 参加者がコメントをつけられるので、以前より、多くの人の意見に感想戦で触れることができた
  • 発表を聞くだけにならず、参加者も主体的に学ぶことができた

悪かった点

  • 要約のスタイルがバラバラだったため、読みにくい部分があった
  • 担当する分量を合わせるために、節レベルで分割したため、章の流れが途切れることがあり、理解が難しかった

第 7 ~ 11 章(回): 要約 with LLM + コメント

やはり、資料として残すときの品質や理解度を考えると、一貫性のある文章であるほうが良いと感じました。そのため、第 7 回以降は、要約に戻すことにしました。
しかしながら、輪講資料を作成するのに時間がかかるため、LLM(Claude3 Ops) を活用することにしました。
まず、私が読みやすさ(フォーマット、構成、文量、文字の装飾等)を気にせずにザッと要約し、それを LLM を使って Markdown 記法で構成を整えることで、資料の品質を高めることにしました。

また、時間効率の点から、コメントは引き続き採用しました。
時間配分は以下の通りです。

  • 黙読・コメント: 40 分
  • 質疑応答・感想戦: 20 分

最後の5章は時間内でしっかりと感想戦ができる勉強会になりました。

「データエンジニアリングの基礎」勉強会のまとめ

「データエンジニアリングの基礎」は非常に良い本でした!
データエンジニアリングの底流等の基礎的なことから企業のフェーズまで、データエンジニアリングに関する幅広い知識を得ることができました。
さらに、データエンジニアとして、他のエンジニアやデータサイエンティストとのコミュニケーションを取る際の知識も触れられています。
現代の大量のデータを裁く上で、巨人の肩に乗ること、いかに車輪の再発明を避けるか、ということが重要であることも繰り返し強調されていました。

また、このようなページ数が多い本でいかに効率よく勉強会を進めるか、ということを試行錯誤し、今回の勉強会は以下のような比較ができました。

方法 時間 品質 発表者の負担 参加者の負担 参加してる感
要約 + 発表
ABD + コメント
要約 with LLM + コメント

今回のような、準備と勉強会の時間が限られていているときは、要約 with LLM + コメントが最適だと感じました。

2. 「データマネジメント」勉強会

次に、「データマネジメント」勉強会を行いました。
データマネジメントに関しては、以下の 2 つの資料を使用しました。

https://bookplus.nikkei.com/atcl/catalog/18/270160/

「データマネジメントが 30 分でわかる本」は、DAMA DMBOK の内容を 30 分で理解できるようにまとめた本です。

既に本の内容が 30 分尺にまとめてくれているので勉強会にそのまま使用して、要約 + コメントの形式で行い、時間配分は、黙読・コメント: 40 分/感想戦: 20 分としました。

「データマネジメントが 30 分でわかる本」を使ったことで、DAMA DMBOK の内容を理解しやすくなります。DMBOK の内容の要約に加えて、実際の業務での適用例を紹介してくれているので、イメージがつきやすいです。

「データエンジニアリングの基礎」と比べると、よりデータの管理やデータアーキテクチャについての話が中心で、データエンジニアリングの基礎を学んだ後に読むと、より具体的な管理方法やデータの取り扱いについて理解できると思います。

3. 「データ志向アプリケーションデザイン」勉強会

そして、次に「データ志向アプリケーションデザイン」勉強会を行いました。
この勉強会では、以下の 2 つの資料を使用しました。

https://www.oreilly.co.jp/books/9784873118703/

「データ志向アプリケーションデザイン」は、大量のデータを扱うアプリケーションを設計する際に考慮すべき事項を解説しています。
また、「30 分でわかるデータ指向アプリケーションデザイン」は、「データ志向アプリケーションデザイン」の邦訳を担当した Taro L. Saito 氏が 30 分の発表資料として作成したものです。
資料はこのスライドをそのまま利用させてもらって私が発表しました。発表中に資料の内容についてコメントをもらい、感想戦を行いました。
時間配分は、発表: 40 分/感想戦: 20 分で行いました。

こちらの資料は、「データエンジニアリングの基礎」よりも更に実装のための知識について触れられており、性能や可用性を考慮した設計を行うためにどのような技術が利用されているかや、アプリケーションのアクセスに合わせた実装例などが紹介されています。
また、「30 分でわかるデータ指向アプリケーションデザイン」は、「データ志向アプリケーションデザイン」出版時にはなかった最新の情報が Saito 氏によって補足情報として追加されています。

まとめ

今回、3 つの資料を使ってデータエンジニアリングの勉強会を行いました。
特に、始めに「データエンジニアリングの基礎」でじっくりとデータエンジニアリングの全体像を把握したのが非常に効果的だったと感じました。その知識が熱い状態で以降の勉強会を行ったため、頭に入ってきやすかったです。

勉強会の進め方に関しては、既にクオリティの高い資料がある場合は、それを用いるのがベストだと感じました。
また、そういった資料がない、もしくは、資料のページ数が非常に多い場合は、要約 with LLM + コメントが最適だと感じました。資料の品質を一定に保ちつつ、フォーマットや装飾に頭のリソースを割かずに爆速で要約することができ、コメントを使って参加者も主体的に学ぶことができるためです。

おわりに

Acompany では、様々な勉強会が毎週 1 つ以上開催されています。例えば、プロダクト部門では今回のデータエンジニアリング勉強会の他にもソフトウェアエンジニアリング勉強会や Rust 勉強会が過去には行われています。また、R&D 部門では暗号理論勉強会、法律関連の勉強会なども開催されています。
これらは、任意参加で、社内の誰でも参加できるようになっています。
また、勉強会立ち上げも非常に簡単で、自分が読んだ本の知見や一緒に勉強したい内容で、カレンダーの空いている時間に突っ込むだけです。

Acompany では、我々と一緒にプライバシーテックの領域で世界を目指してくれるメンバーを募集しています。まずは、カジュアル面談で Acompany という会社のことを知ってもらいたいです。
https://recruit.acompany.tech/#84ba9c895d464495a63fd437bac75431

また、弊社の他のブログは以下エンジニアブログハブから見られます!
https://engineering.acompany.tech/

Discussion