2022年の振り返りと勉強する意味
はじめに
普段は技術記事しか書いていないのですが、2022年もそろそろ終わりということでポエムな振り返りを書いていこうと思います。
これまではバックエンドエンジニア兼機械学習エンジニアという立ち位置が主だったのですが、現在はレコメンドを主に担当する機械学習エンジニア兼KPI分析のデータサイエンティストという立ち位置になりました。思えばAIがやりたいと京都大学情報学科の門をたたき、単位の出ない理学部の数学などを勉強してきたのですが、その経験が生きた一年になったかなと思います。
勉強する意味について
今年は勉強することが多かった一年でしたが、みなさんは勉強する意味はと聞かれてどの様に答えますか?
かつて大学附属の博物館の輪読会に通っていた頃、この話題になったことがあるのですが、そこで私は「それを語るならまずプランクトンから話をはじめないといけないと思う」と言った時、すかさず館長が「私もそうだと思う」とおっしゃいました。
私が続けて言ったのは、「かつてプランクトンは水に触れながらこっちにエサがありそうだとやっていた。それがカンブリア紀、生物は眼を持つ様になった。実際に触れなくても世界を知ることができる様になった。そして中生代シルル紀、生物は陸上に進出した。濁った海水では見通せなかった遠くの大地まで見通せる様になった。そして現代、人類はかつて存在すら知らなかった情報そのものを見ようとしている。新たなものを見ようとするのは自然なことだと思う」という意見でした。今でも同じことを思っています。
みなさんの思う勉強する意味はなんでしょうか?
レコメンド
今年は主にレコメンドを協調フィルタリングからアップデートするというタスクを任せていただき、それに取り組みました。
まず、データとして個人情報などをマスクされた形でdevelopに上がっていたので安心して取り組めました。その上で、かなり大量にデータがあったため比較的取り組みやすかった感があります。
大まかに言えば Deep Learning を用いて性能を向上させたのですが、論文でも Deep Learning を普通に使うだけでは性能はむしろ悪化すると言われている中、オフライン指標で性能を向上させた点が取り組みがいがありました。
ちなみにオフライン評価のシステムから作ったことで精度指標の定義などがおさらいできました。
また、そこそこ大きいモデルを扱いながら高速にレスポンスを返す手法も勉強できました。
KPI分析
次にKPI分析を統計的手法を用いて行うというタスクを担当しました。
統計分析はt検定しか載っていない本が多く、検定といえばt検定と言いたくなりますが、こちら正規分布であることを仮定しています。データの分布に合わせて検定の手法を選択すると言ったことが必要になりました。
また、API化する際にDDDを意識する様にしました。
技術アドバイザー
今年から、副業で技術アドバイザーをさせていただいているのですがこれは初めての経験でした。実装するメンバーが考えてわからなかった点にその場で答えていく形式で、論点の整理(アーキテクチャの問題なのかAIモデルの問題なのかなど)、レコメンドでいうとこういう風に解決することが多いという類比、私ならこうするという回答、の形式で答えられていたと思うので、これからも貢献できるようにしていきたいです。
まとめ
みなさんの2022年振り返りを見るのが好きなので、ぜひ投稿しませんか?
それでは良いお年を。
Discussion