AI系の研究のために読んだ本メモ
これまでに読んでよかった本を紹介していくコーナー
書籍は力なり。学部でAI系の勉強をしてこなかった人間が医療AIの研究を始めて約3年経った。これまで論文に加えて色々な本に目を通してきたので、個人的によかったものを残しておく。
基礎
こちらもベストセラーとして名高い東北大の岡谷先生本。実装はないが、幅広くAIモデルや関連技術が収められている。辞書代わりとしてあると良い一冊。
網羅的な本といえば、こちらも。アイシアちゃんいつもありがとう。強化学習もあるのが嬉しいポイント。岡谷本より少し丁寧だろう。
プリファードの岡野原さんによるもの。図解も多く分かりやすい。VAEの感覚やAttentionの中身はこいつで掴んだ覚えがあります。
Data Science
改訂第3版で最新のTransformerや拡散モデルといった最新モデルの説明にも対応。基礎的なデータサイエンスの内容(Cross-validationとかClusteringとか)から最新の内容までコード付きで学ぶことができる一冊。pytorchではなくtensorflow2.0なのが人によっては減点ポイントか。訳書だが日本語は全体的に自然な印象。分厚い。鈍器。
Computer vision
こちらも良書としてしばしば上がる東大原田先生本。特徴抽出から始まり、基礎的な画像AIまでを紹介。上の『ディジタル画像処理』よりは数式の行間が狭く丁寧だった印象。
上記の2冊には含まれていないが、最近では主流となっている拡散モデルについても触れらている一冊。正規分布や行列の基礎から始まり、最尤推定、ガウス分布、VAEを経由して拡散モデルの導出及び実装をpytorchのコードつきで紹介。 最大限に数弱の人に寄り添う姿勢は非常に好感が持てるが、ラボで輪読会をしたところ初学者はおいていかれるところが多々あったらしい。とはいえ、本書の構成は見事の一言。
自然言語
ChatGPTで注目を集める自然言語処理界隈で、良書として名高い一冊。Attention構造やTransformerが図で書き下されて説明されており、分かりやすい。 実装はないが、それを見据えた細やかな配慮が垣間見えるのも嬉しいポイント。流石です!岡崎先生。
LLM界隈でよく取り上げられる2冊。huggingfaceを用いた言語モデルの取り扱いの仕方、具体的なタスクの解き方が分かるようになっている。図も豊富で分かりやすい。
強化学習
こちらには深層強化学習の内容も入っている。前半部分に基礎がまとまっているが、そこが非常に分かりやすい。その部分(約30ページ)を読むためだけにでも購入を検討する価値がある。
統計
先ほどの赤本は定番だが読んでいても面白くないとは思う。教科書なんだから当然だろうと思われたかもしれないが、こちらの松原先生の1冊は読んでいて普通に面白かった。松原先生の本、好きです。今でも精力的に活動されているようで、今後の出版を楽しみにしております。
別にふざけているわけではないし、京大生だから佐藤先生に忖度しているわけでもない。いや、タイトルがふざけていると思われるのは仕方がないのかもしれないが。統計を一通り勉強した人、医療統計には関わりのない人でも読んでみてほしい。 会話調なのでサクサク読める一方で、個人的には気付きが多かった。読みながら「いや、それな!」とか「ほんとにあった怖い話だこれ…」となって楽しい。
因果とか
因果推論とは違うが、因果探索(観察データからグラフを作る)の入門には清水先生のコレ。基本から始まって、LiNGAMという代表的なアルゴリズムまで無理なく到達できる。実際にやってみたい場合は、使いやすいpython packageがリリースされているので、それを動かしたり実装をみたりするとより理解が深まるだろう。
ベイズ
先ほどよりは理論寄りの1冊。数式の展開は頑張れば追える。定番の入門書として知られる。
先ほどの須山本よりも式展開が丁寧。VAEの式変形とかはこれで追った記憶がある。ただし、誤植がそこそこ… 誤植を探しながら読む、という勉強法もありか。
定番中の定番として名高いが、個人的には「癖つっよ」という印象を抱いている。 難易度は高い。(実はいまだにちゃんと読み切れてはいない)縦ベクトル表記と横ベクトル表記が混ざっていたりなど、ちょっとしたトラップもある。
最近、ChatGPTがこの本の内容やよくある質問を覚えていることに気がついた。世界中の人が参考にしていることの何よりの証左とはいえ、ちょっと面白かった。
プログラミング関係
逆に、他の言語からpythonに移ってきた人はこの本とかでpython特有のやり方や特徴をざっと学んでも良いのではないかと思う。自分は初めてデコレータ見た時に「なんだコレ?」となって、この本の第1版で調べました。
その他
現時点では、音楽生成やマルチモーダルモデル、世界モデルについてちゃんと触れられている唯一の和書ではなかろうか。 実装がtensorflowなのが減点だという人もいるだろうが、内容をざっとみるだけでも興味深いだろう。ただし、和訳にところどころ不自然な部分があるように感じられる。とはいえ、読む分に問題はない。
深層学習の理論について平易な日本語で解説されている。 新書であることからわかるように、縦書きである。数式については今泉先生が日本語で書き下してくださっているので、お気持ちを受け止めるのは容易。個人的に、深層学習の理論おもろそうやん!と思うようになったきっかけの一冊。
NII佐藤さんの1冊。最近のAIはバカでかモデルばかりだが、そいつをうまく扱ってやるための基礎知識が詰め込まれている。 ただ網羅的に並べるだけではなく、どんな場面で有効な手法か等についても整理されている他、実際にどれくらい早くなったのか確認できる実装も存在。1人でここまで調べ、理解し、適切な粒度で分かりやすく説明された本がこんなにも素早く出版されているという事実が恐ろしい。(日本語で!)凡人なもんで、いや、ホントに助かります。ありがとうございます。
LLMについての岡野原さんの新書。一般向けとして平易に、しかし、ちゃんと正確に記されている。強い人がガチになると一般向けでもここまでできるのか、と思わされた1冊。
個人的には興味深く読ませてもらいましたが…
杉山先生、あの、初学者の読み物としては勧められないかもです…
いや、面白かったです、面白かったんですけど、教養のレベル高くないですか…?
数学系
基礎からフーリエ変換まで。式展開も丁寧で、分かりやすい。コラムが面白くためになる。
研究お役立ち
兎にも角にも、自分が学部生の段階で論文を書き上げるということができたのはこの本のおかげ。ありがとう。(良い論文になったとは言ってない)
申請書の書き方について。あと、推薦書の書き方についても例があるのが個人的には嬉しいポイントだった。大変お世話になりました。
こちらも申請書の書き方について。分野が近かったので例など、大変参考になりました。
Discussion