🦌

DAL 社内勉強会の紹介 -2024年度下期編-

に公開

はじめに

データアナリティクスラボ株式会社の宮澤です。
今回は、弊社内で行っている社内勉強会の取り組みについて紹介の第2回目になります。
2024年度の上期編はこちら☟
https://zenn.dev/dalab/articles/f3b43fd24aa830

社内勉強会の概要

弊社には「ラボチーム」という有志のデータサイエンティスト社員で組織された技術チームがあります。本チームが主催となり毎週1回の社内勉強会を開催しています。最近は他(の専門分野を担当している)チームのメンバーや、ラボチーム以外の社員からも登壇しており、幅広いテーマで勉強会を開催しています。

2024年度下期はこんなテーマがありました!

ニューラルネットワークの損失関数について

Speaker Deckにて公開されている「ニューラルネットワークの損失地形」(佐藤 2024)という資料を拝借して、発表者が説明をする形式で勉強会を実施しました。損失関数の平坦解がなぜよいとされるのかを学びました。

Cursorの紹介

AI支援機能を搭載したコードエディタの一つであるCursorの概要と使い方を紹介しました。

数理最適化でDAL運動会チーム分けを行う!

2024年10月に開催された社内交流イベント「DAL運動会」の運営メンバーが、参加したい競技のばらつきや入社後年数のばらつきをうまく調整して、チームの偏りがないように組み合わせることを、数理最適化を用いて取り組んだという事例を紹介しました。
DAL運動会については以下をご覧ください!

https://www.instagram.com/p/DC8xOrPT8I_/?igsh=MWw3bnJvOXZ4ZHo3Yg%3D%3D&img_index=1

ファインチューニング習得PJ 成果発表

ファインチューニング習得PJとは、社内で約半年にわたって企画実行されていたプロジェクトです。LLMの基礎からファインチューニングの実装までをメンター2名のもと習得するためのものです。4名の社員が手を動かしながらファインチューニングの実装までをできるようになりました。社内勉強会の場でその成果発表を2名ずつ2回にわたって実施しました。
プロジェクトについては以下をご参照ください!

https://zenn.dev/dalab/articles/8bcfcfd4c1f1f4

進化的モデルマージを用いた日本語金融LLMの構築の取り組み紹介

弊社のお客様との共同研究としてSIG-FINで発表した研究成果を社内向けに勉強会として発表および解説しました。
発表については以下をご参照ください!

https://dalab.jp/archives/6714/

ベイズ推論入門

「ベイズ推論とは何か?」を最尤推定法との違いから解説しました。理論だけではなく具体例を用いて理解を深めました。

AIエージェント入門

AIエージェントとは何か?というところから、Difyを活用したAIエージェントのワークフロー作成について紹介しました。当時リリースされたOpenAIの「Swarm」を使った実装も紹介しました。

https://zenn.dev/dalab/articles/1d4f649c8005a0

atmaCup 18 振り返り

社員3名で参加していたatmaCup #18の取り組みやそこで使われた技術・考え方、それに加えて上位解法の取り組みを解説しました。

https://zenn.dev/dalab/articles/2148b5616a9304

LLMファインチューニングに関するウェビナーのリハーサル

以下で開催したLLMのファインチューニングの理論と実践に関するウェビナーのリハーサルを社内勉強会の形式で実施しました。
以下に資料も添付されていますので、ぜひご覧ください!

https://connpass.com/event/337694/

ラボチームの学び方を知ろう!

2024年最後の勉強会は緩いテーマで開催しました!技術力で会社を牽引しているラボチームのメンバーに、「どうやって新しい技術をキャッチアップしているの?」「情報収集はどんなツールを使っている?」「わからないことがあったときの対応方法は?」「数学の苦手意識があるけどどうすればいい?」といった社員のお悩みにラボチームメンバーが回答しました。

Kaggle Eedi 振り返り

社員3名で参加していたKaggleコンペの振り返り会を行いました。使われた技術・考え方、それに加えて上位解法の取り組みを解説しました。

https://zenn.dev/dalab/articles/e56f7691cc7c8d

生成モデル基礎

画像などを生成することができる「生成モデル」の基礎である最尤推定法、混合ガウスモデル、EMアルゴリズムなどの要素技術を解説しました。また、VAEや拡散モデルについても概要に触れ、生成モデルに関わる技術の基礎の理解を深めました。

画像分類入門

CNNを用いた基本的な画像分類の基礎理論とサンプルコードを解説しました。発表者の自宅で飼っているネコと他のネコ・イヌを判定するモデルを作っており、社員の強いネコ愛を感じました。

画像トークナイザーとは?

LLMのテキストトークナイザーとは異なる画像のトークン化の手法を、Vision Transformerの概要を交えて解説しました。VQ-VAE、TiTok、One-D-Pieceなど各手法も紹介しました。

Polars基礎・Polars100本ノック

Polarsの基本的な使い方と、Pandasとの違いや処理高速化のテクニックについて解説しました。また、弊社役員である森谷が作成した「データサイエンス100本ノック」を使って、この100本ノックをPolarsで処理するという取り組みを行い、その実装解説を行いました。

https://github.com/The-Japan-DataScientist-Society/100knocks-preprocess

量子コンピュータとは?

実案件で量子技術を持ちいた最適化に取り組んでいる社員が「量子コンピュータとは何か?」というテーマで発表を行いました。以下の弊社オウンドメディアでリリースしている記事をもとに、執筆者自ら解説をしました。

https://dalab.jp/mag/methods/quantum-computer/

書籍紹介 『AIに勝つ数学脳』

AIに勝つ数学脳』(早川書房)の紹介を行いました。AI時代で人間がどう問題を解くべきなのか、という点に焦点をあてて説明しました。

NLP2025 参加レポ

社員2名で参加した言語処理学会第31回年次大会(NLP2025)の報告会を行いました。自分たちの発表はなかったので、聴講した発表で興味深かったものや優秀賞を獲得した論文を読んで、社内向けに勉強会形式で紹介および解説を行いました。

空間統計学入門

地理情報データや地理情報システムに興味のある社員が「空間統計学」というテーマで基礎理論を解説しました。

おわりに

弊社ではこのように、ラボチームが主導となって毎週の技術勉強会を行っています。様々なクライアント様と業務をさせていただいているため、特定の分野だけではなくデータサイエンスやAIに関わる幅広い分野の知見を持っているのが弊社の特徴です。

本格的に勉強会を始めたのは2024年上期からですが、2024年度全体では合計50回ほど開催することができました! 2025年度も引き続き取り組んでいきますが、2024年度は技術基礎が多かったため、より応用的な発表を増やしていきたいと思っています。

弊社にご興味を持っていただけた方は、下記の採用サイトからお問い合わせください!

DAL Tech Blog

Discussion