AIエンジニアの学習方法論 ②AI技術情報リソースのおすすめとその探し方
はじめに
AI技術のR&Dを担当している木村です。この記事はambr, Inc. Advent Calendar 2024の14日目の記事で、AIエンジニアの学習方法論シリーズの第二弾です。
前回は「理解すること」というメタスキルに焦点を当て、その重要性を考えましたが、今回はもうひとつの欠かせないメタスキル、「必要な情報を見つけ出す」力に注目します。
AI技術は日進月歩で、毎日新しいフレームワークや手法が登場し、関連書籍や記事も膨大な数が発信されています。こうした膨大な情報の中から、自分に必要なものを素早く見極め、取り出すことは簡単ではありません。しかし、この「情報探索力」は、「理解する力」と同様に、エンジニアとして成長し続ける上で避けては通れないメタスキルです。
本記事では、私自身がこれまで多くのAI関連情報リソースに触れ、試行錯誤を重ねる中で見出した「おすすめの情報源」や「効率的な探し方」をまとめて紹介します。これを通じて、皆さんがAI分野で必要な知識に効率よくアクセスし、より効果的に理解を深めるためのヒントを得ていただければ幸いです。
これからAI技術を学び始める人
『ゼロから作る Deep Learning』
斎藤康毅さんによる『ゼロから作る Deep Learning』シリーズは、初心者に特に適した入門書です。コンセプトの丁寧な解説とコード実装例が一体となっており、理論と実践を行き来しながら理解を深められます。
たとえば、一冊目の『Pythonで学ぶディープラーニングの理論と実装』では、誤差逆伝播や勾配降下法など初心者が敬遠しがちなトピックも、わかりやすい比喩や例を通じて着実に理解できるようになっています。また、続編では自然言語処理や生成モデル、さらにはフレームワークに関する内容など、学びたい領域に応じて選べるラインナップが揃っています。
ある程度理解が進み、確実な力を身につけたい人
線形代数
数式を理解し、最新の論文や専門書にスムーズに取り組むためには、数学的リテラシーが欠かせません。特に線形代数や確率論の基礎知識は必須です。以下に挙げる本についても、これらの理解が前提となっており、逆にこれらを習得しておけば、参照できる情報ソースの範囲が一気に広がり、学習の深度が増します。
線形代数を学ぶ際は、『線形代数学』(笠原晧司著)や『線形代数入門』(斎藤正彦著)がおすすめです。後者はやや厳密な記述が多く、慣れるまでは難解に感じられるかもしれません。そのため、特別な理由がなければ前者から始めるとよいでしょう。
講談社 機械学習プロフェッショナルシリーズ
機械学習プロフェッショナルシリーズは、ベイズ深層学習やグラフニューラルネットワークなど、個別テーマに特化した書籍がそろったシリーズです。基礎から応用までを扱い、数式展開も省略せず丁寧に説明しているため、総合的な理解を構築するうえで非常に役立ちます。
学びを進めるうちに、「なぜこの手法を選ぶのか」「どのような基準でモデルを比較すべきか」「他の技術とどのようにつながっているのか」といった疑問に直面することがあるでしょう。次のような悩みがその一例です。
- データ数が少ないからモデルをもう少しシンプルなものにしたい…いい方法はないかな?
- KLダイバージェンスって何?そもそもなぜこんなものを考慮しないといけないのだろう…?
- グラフ構造を持つモデルを試してみたいけど、そもそもどう定式化すればよいのか分からない
本シリーズは、こうした要素技術を体系立てて説明しているため、背景知識や他分野との関連性を踏まえた上で、それぞれの手法の特徴を比較検討できます。結果として、上記のような疑問に対するヒントを得やすくなるでしょう。
Deep Learning
『Deep Learning』はDeep Learning分野で世界的に定評のあるスタンダードな一冊です。分からない概念に出会ったとき、まず参照できる基礎辞典的存在として重宝します。
本書は多様なDeep Learning技術をバランスよく網羅しており、体系的にまとめられています。新たな領域を学び始める際、「自分が知りたい項目はどの分野に属するのか」や「どの参考書にあたればよいのか」といった戸惑いが生じがちです。そんなときは本書の索引で関連用語を引き、その周辺を読むことで全体像をつかむことができます。より詳しく学びたくなったら、そこから専門書へと進むことも容易です。いわば、Deep Learning界における百科事典や世界地図のような存在といえるでしょう。
たとえば、「CNNとは何なのか?」と疑問に思った際には、用語索引から該当箇所を見つければ、CNNが数多あるニューラルネットワークモデルの一種であること、その名称が数学的なconvolution演算に由来していること、またその特徴や関連モデルとの比較までを含めて理解できます。さらに、CNNを全結合モデルの特殊ケースとして捉える視点など、幅広い脈絡で技術を位置づける手がかりも得られます。
今後長くDeep Learning技術に関わるのであれば、本書は手元に置いておくべき基本書といえるでしょう。
視覚的理解リソース
3Blue1Brownのチャンネルでは、確率的勾配降下法・誤差逆伝搬法・アテンション機構などの基礎理論が直感的に理解しやすいアニメーションを使って説明されています。難しい数式の理解につまずいて悩んでいるときなどは特に役に立つでしょう。私自身、自分の理解のヒントとしてだけでなく、他者にコンセプトを説明するためのビジュアル素材としてもよく活用しています。
参考書を探す場所
丸善:
AI技術関連の参考書は、コンピュータ関連書と学術専門書の双方にまたがっています。多くの書店ではいずれか一方に特化していることが多く、欲しい本が見つからない場合がありますが、丸善はいずれをもカバーしながら、特に学術的な専門書を豊富に揃えており、探している本を見つけやすい環境が整っています。
大学図書館:
最先端の技術や大学で基本書とされるような大著は、英語のみで出版されている場合も少なくありません。そのような洋書は高価なことが多いので、購入前に図書館で内容を確かめるのが賢明です。多くの大学図書館では蔵書データベースが整備されており、目的の書籍を所蔵する館を事前に特定できます。外部利用に制限があるところもありますが、大半は学外者でも閲覧可能です。事前に利用条件を確認してから訪れるとスムーズでしょう。
AI活用方法のアイデア探し
レビュー論文
レビュー論文(サーベイ論文)は、ある領域の研究動向を俯瞰的にまとめた二次的資料です。最新モデルに用いられる技術や研究の全体像を把握する際、初期調査の情報源として非常に有用です。多くの場合、タイトルの末尾に “A Survey” と付くため、検索の目安になります。
例:「Differentiable Rendering: A Survey」
OpenAI Cookbook
OpenAI Cookbook には、OpenAIが公開している多様なモデルの活用例が豊富に掲載されています。モデルの具体的な使い方を知る参考になるほか、新規プロジェクト立案時のアイデアソースとしても役立ちます。日々の業務の中で実際に、効果検証用モックを作成する際の土台として活用したものも多いです。
まずはAIに関する興味関心を深めたい人
技術書を中心に列挙しましたが、技術や理論の勉強ばかりでは単調になり、飽きてしまうこともあるかと思います。そんなときには技術書以外にも目を通してみるといいと思います。
ユヴァル・ノア・ハラリ
AIや最新テクノロジーについて、人類史の観点から考察した『Sapiens』や『Homo Deus』は世界的ベストセラーになっています。技術の発展と歴史の軌跡は密接に関係しあっていて、技術の理解抜きでは歴史を読み解くことはできません。その可能性もリスクも未だ見当がつかないAI技術について、ハラリ氏は歴史学者の立場から、人類の誕生から現代までの歴史を振り返ったうえで、それらはいったいどのように位置づけられるのか、どのようなシナリオが考えられるのか、どういった心構えであるべきか、その壮大なスケールの人類史に基づいて説明しています。ユーモアあふれる説明やなじみ深い具体例で大変読みやすくありながら、かつ、読者を本質的な議論に導いてくれます。
これからAI技術に長く関わっていく方にとっては、必読の一冊だと言えるでしょう。私がAI技術への関心を強くするきっかけになったのもこの本の影響で、とても思い出深い本です。
Max Tegmark
AIについては、進化のスピードが著しく、特にその本質を理解することが難しいためか、万人に共通するような認識が築かれておらず、そもそもAIについてまともに議論すること自体が難しいという問題があります。いざ他人と議論しようとするにも、各々の理解がすれ違ったままになり、結局は不毛な議論に終わってしまうことが多いのではないでしょうか。これはなにも、一般の人々との間だけに限らず、普段からAI技術に関わっている研究者やテックカンパニーの意思決定者同士などで行われる議論においても同様です。テグマーク氏はFuture of Life Instituteという非営利組織を立ち上げ、その活動の一環としてbeneficial-AI campaignというカンファレンスを行っています。そこでは、AIの発展を担う研究者やテクノロジー企業関係者が集まり、議論を進めることで、互いの誤解や意見の相違を明らかにしながら共通の認識を築き上げていくことによって、建設的な議論ができる土台を作ろうとしています。ここから得られた知見を活用することで、たとえ、AIの仕組みを深く理解することはできなくても、陥りやすい落とし穴について予め理解しておくことで、本質に迫る適切な議論ができるようになるはずです。
『Life 3.0』ではそのような活動から得られた知見も含めながら、AIについて詳しくない一般の読者にも理解できるような丁寧な説明もあり、建設的な議論を促す内容になっています。
Lex Fridman Podcast
Lex FridmanによるPodcastは、AI技術に関わるキーパーソンや、その周辺領域の人物への長時間インタビューで構成されています。その人の生い立ちや考え方、話し方や人となりまで、SNSやWeb記事などの断片的な情報からではなかなか目にするができないようなことまで知ることができます。Podcast開始当初は”The Artificial Intelligence Podcast”というタイトルで、Elon Mask, Sam Altman, Demis Hassabis, Mark Zuckerbergなど、AI技術に関わる主要人物が中心でしたが、最近はDonald TrumpやBenjamin Netanyahuなどの政治関係者やその他セレブリティまでその対象が拡がってきており、近日中にはVolodymyr Zelenskyy氏にもインタビューする予定であるとのことです。
このような幅広いゲストとの対話インタビューから、最先端のAIやテクノロジーを取り巻く国際的な状況や社会的な意味合いについて、考えを深めることができるでしょう。
最後に
以上、AI技術情報を得るための情報リソースをご紹介させていただきました。少しでも参考になれば幸いです。次回はAI最新技術にアクセスするためには欠かせない、英語の一次情報を読み解くためのスキルについてまとめる予定です。
Discussion