DS部2023上期勉強会まとめ
この記事について
D2Cデータサイエンティストの吉井です。
私はリサーチ関係の業務に携わっていて業務の一環として社内の勉強会を運営しております。先日上期の勉強会が終了し発表内容をまとめていたところ、せっかくならどんな社内勉強会を開いているのか社外の方にも紹介してほしいという依頼を受けて本記事を執筆する運びとなりました。
社内勉強会について
私が所属するデータソリューション部では各個人が最近調べたor学んだテーマについて共有を行う勉強会を行っています。発表するテーマは自由でノルマもなく、発表者以外は自由参加で途中参加離脱ありのゆるい空気感で実施することを目指しています。最近は社内でのアピールが功を奏したのか他部署の方も聴講に来るなどして賑わいを見せています。
この記事の目的
先に紹介した通りテーマを自由に設定してるため発表ジャンルは多岐にわたります。
詳細な内容まで踏み込むことはできませんが、今回のまとめ記事を通して我々の部に所属する人がどういう技術領域に興味を持っているのかを知ってもらえればいいなと思います。
発表内容一覧
以下に発表内容ごとにタイトル、発表者および資料の切り抜きを交えてどんなテーマかを一言でまとめて紹介していきます。
NeRFの調査 [吉井]
複数の視点画像からシーンを学習し新たな視点画像を生成する手法「NerF」について調査しました。NeRFの学習の手順をできるだけ丁寧に説明し、他の派生手法を簡単に紹介しました。
Proximal Policy Optimization [董]
強化学習の代表的な手法であるPPOについて紹介する資料です。強化学習は未経験の人も多いため基礎知識から紹介し、実装例まで共有してくれています。
AWS Summit Tokyo 2023 参加レポート [須田]
AWS Summit Tokyo 2023に現地で参加した須田さんがレポートにまとめてくれました。リコーやニンテンドーなど国内の代表的な企業がAWSをいかに活用しているのかを紹介しています。
色んなCVR予測モデルのアーキテクチャを試してみた [遠藤]
CVR予測のNNモデルについて紹介してくれた資料です。 ESMと呼ばれる手法を中心に解説し、社内データを使った検証まで紹介してくれています。
Drag Your GAN [董]
GANをインタラクティブにする研究の紹介です。GANで生成された画像をマウスでドラッグして思うように編集する技術です。
ハッシュについて [小林]
様々なハッシュアルゴリズムについて調査した資料です。ハッシュアルゴリズムごとに計算にかかる時間を評価する実験も合わせて紹介してくれています。
InstructPix2Pix [董]
拡散モデルを利用した画像編集に関する論文の紹介です。オリジナルの画像に対して編集内容を言語で指定することで画像を変換することができる技術です。
Spotify apiについて [城田]
Spotifyが提供するAPIの紹介をしてくれた資料です。城田くんが実際に挙動を確認したnotebookと合わせて紹介してくれました。
Airflowで考えるワークフローエンジンの本質 [須田]
エンジニアがしばしば直面する本質的でないコーディング、ネガティブエンジニアリングを回避するにはどうしたらよいのかについて考察した資料です。後編のPrefrectの紹介につながる導入にもなっています。
poincare embedding [名越]
自然言語タスクを想定したポアンカレ空間への埋め込みについて紹介した資料です。基礎や概要について紹介した後notebookでの実験も併せて紹介してくれています。
TSDAE [董]
自然言語タスクにおいて文章の表現を得る手法について紹介した資料です。文の分散表現を得る手法の経緯を紹介したあとに具体例としてTSDAEで日本語文の分散表現を取得するコードを実装し、さらには社内データをつかって効果の検証まで行ってくれています。
SPARF [吉井]
少ない画像、曖昧なカメラパラメータで3Dシーンを学習可能なSPARFと呼ばれる手法を紹介した資料です。NeRFの派生手法なのでNeRFの復習をしつつ差分について詳細に解説しています。
サーベイ風 LLMに至る自然言語モデルの系譜を 今よりは知った気になろう(Part 1) [Tさん]
最近注目を集めているLLMについて背景やこれまでの発展の歴史を学ぶため、自然言語とニューラルネットを軸に経緯をまとめている資料です。前編では再帰型のモデルやWord2Vecについてまとめてくれています。
Prefrectを使ってみた [須田]
ネガティブエンジニアリング回避のための解決案としてPreferectを挙げて紹介してくれた資料です。PrefrectではDAGを書くことなpython-likeにFlowを記述可能なようで、実際に使ってみたコードをnotebookで共有してくれています。
early bert [名越]
Bertが発表された頃から大規模な言語モデルが台頭するようになり推論時間が長くなった事を受け、より早く計算をしようとする技術の紹介です。推論の高速化は様々なアプローチが提唱されていますが”枝刈り”について注目した技術を紹介してくれています。
最後に
本記事は勉強会で扱っているテーマを通してデータソリューション部のメンバーがどんな領域に興味を持っているのかを理解してもらうために執筆しました。D2Cへの転職や入社を希望している方に少しでも部の雰囲気が伝わっていれば幸いです。
採用情報
D2Cグループはエンジニア、データサイエンティストを募集しています。
ブログを読んでD2Cで働いてみたいと思った方、D2Cの業務に興味がある方がいらっしゃいましたら是非ご応募ください。
▼ D2Cグループ採用サイトはこちら
▼ D2C問い合わせフォームはこちら
株式会社D2C d2c.co.jp のテックブログです。 D2Cは、NTTドコモと電通などの共同出資により設立されたデジタルマーケティング企業です。 ドコモの膨大なデータを活用した最適化を行える広告配信システムの開発をしています。
Discussion