🐀

Bayesian Data Analysis 3 (BDA3)の翻訳本『ベイズデータ解析 第3版』はいいぞ

2024/07/02に公開

ついにBDA3の翻訳が森北出版から出版されました!

https://www.morikita.co.jp/books/mid/009703

そもそもBDA3って何?

Bayesian Data Analysis 3rd editionの略です。Andrew Gelman先生、John B. Carlin先生、David B. Dunson先生、Donald B. Rubin先生ら超一流の著者陣によるベイズの教科書の第3版です。

原著は2013年に出版された本だぞ、古いのでは?

全く古くありません。線形代数は古いから使わない、線形回帰は古いから使わない、そんなことないですよね?ベイズ統計をベースにした考え方はfundamentalな技術であり、モデルが線形回帰だろうと深層学習だろうと拡張できますし、欠測補完や因果推論といった問題設定とも相性が良いです。超一流の著者陣による色褪せない理論の説明とデータ解析例を味わいましょう。

とはいえコードとかは古くなるでしょ?

この本ではコードはAppendixにしか登場しないので影響はほぼありません。その代わりにBDA3を使った授業ページにおいてコードが充実しており、かなりの頻度で更新されています(現在は2023年10月版)。
https://avehtari.github.io/BDA_course_Aalto/index.html

  • Rによるデモはこちら
    • CmdStanRやRStanによるデモはこちらに含まれています
  • Pythonによるデモはこちら
    • PyStanによるデモはこちらに含まれています

どんな本?

大きく5部に分かれており、専門家が書いた4冊ぐらいをまとめて1冊にしたような本です。理論の説明とデータ解析例のどちらの情報も豊富です。一方でコードやコードの説明はほとんどないです。数式はそこまで多くないうえに『パターン認識と機械学習』より少し易しいと思います。『ひたすら式変形してて事後分布を計算してる本』や『コードがどんどん出てきて事後分布を計算してる本』ではありません。饒舌なまでに文章で説明されています。そのため日本語で読めるのは嬉しいのです。

個人的に特に好きなのは以下の部分です。

  • I部:1章と4章、漸近論を含む伝統的な統計学とベイズ統計学の接続。
  • II部:全部の章。事後予測分布を使ったモデルの評価、情報量規準を使った比較、因果推論、打ち切りと切断、意思決定分析など。
  • III部:12章のハミルトニアンモンテカルロ法の実装(授業ページにはNUTSを実装したRコードもある!)、13章のラプラス近似・変分ベイズ・期待値伝播法などの近似法のはなし。13.2.4節に実務でよくわからなかったことがあった共分散行列に対する退化回避事前分布も載っていて良かった。
  • IV部:18章の欠測データのモデル。この章はRubin先生が書いてますね(確信)。ベイズによる本物の多重代入法を見せてあげますよって感じです。
  • V部:23章のディリクレ過程モデル(ノンパラベイズ)。第3版で新たに付け加えられただけあってかなり詳しいです。

上記のような統計の複数テーマを横断的に扱うような話題が多いため、この本を読んで統計を学びはじめようという初級者向けではありません。しかし、統計にある程度詳しい人がベイズ統計に入門したい場合、実務でベイズモデリングを使っている人が理論面を補強したい場合、ベイズ統計を使った論文を書く予定がある場合には、この本ほど適している本はないでしょう。統計やデータサイエンスを主とした研究室や企業における輪読にもぴったりだと思います。

日本語はどうよ?

はじめて翻訳された『ベイズデータ解析 第3版』を読んだとき、「あれ?こんなにBDA3って読みやすかったっけ?」と戸惑いました。翻訳は現時点において日本の若手研究者のベイジアンのなかで最も信頼できると思っている株式会社Nospareのメンバーを中心として行われています。Nospareの宣伝も兼ねているのでしょうね、ショボい翻訳なんか出せるかという気迫を感じました。

Enjoy!

Discussion