言語モデル関連おすすめ本の紹介
今回は大規模言語モデルの理解に役立つ書籍をいくつか紹介します。
どれも200ページ前後になるので、気軽に読める分量です。
今後大規模言語モデルを利用する機会が増えると考えられるので、ぜひ参考にしていただければと思います。
大規模言語モデルは新たな知能か(岩波科学ライブラリー)
「対話型サービスChatGPTは驚きをもって迎えられ、IT企業間で類似サービスをめぐる激しい開発競争が起こりつつある。それらを支える大規模言語モデルとはどのような仕組みなのか。何が可能となり、どんな影響が考えられるのか。人の言語獲得の謎も解き明かすのか。新たな知能の正負両面をみつめ、今後の付き合い方を考える。」
著者の奥野原先生はディープラーニングやAIの書籍を多く出版されています。
本書は一般向けに書かれており、数式が苦手な方でも大規模言語モデルの外観をつかむことができます。
ChatGPTの頭の中(ハヤカワ新書)
「人工知能チャットボット「ChatGPT」の知られざる仕組みと基礎技術について、自らも質問応答システムの開発に携わる理論物理学者が詳細に解説。今も進化し続けるChatGPTが、将来的に人間の脳に匹敵する「思考の本質」を身につける可能性が鮮やかに示される」
この書籍も同様に一般向けに書かれていますが、より技術的な内容に踏み込んでいます。
著者は質問応答システム「WolframAlpha」の開発者で、そのため「WolframAlpha」の使用に少し偏りが感じられるかもしれませんが、内容は深く、タケノコのように出版される「GPT~」本とは一線を画す骨太の内容となっています。
WalframAlpha自体はとても興味深いです。
GPTが得意としていない「正しく計算をする」ことが可能です。
ヒトの言葉 機械の言葉 「人工知能と話す」以前の言語学(角川新書)
「私たちは本当に、「意味」が分かっているのか
AIが発達しつつあるいま、改めて「言葉とは何か」を問い直す――
AIと普通に話せる日はくるか。
人工知能と向き合う前に心がけるべきことは。
そもそも私たちは「言葉の意味とは何か」を理解しているか。
理論言語学出身の気鋭の作家が、言葉の「不思議」と「未解決の謎」に迫る」
こちらは大規模言語モデルというより、機械がどのように言葉を解釈し処理するのか、人間の言語の特徴と相対化して探求しています。
この視点から機械とのコミュニケーションを再評価することで、たとえばGPTがなぜ特定の指示を正確に解釈できないのかという問題に対する理解が深まります。
働きたくないイタチと言葉がわかるロボット 人工知能から考える「人と言葉」(朝日出版社)
川添先生の著書でお勧めをもうひとつ。
すこし古い(2017年出版)ですが、「言葉を理解する機械」を中学生でも理解できるように物語として紡がれています。
働きたくないイタチがまさにChatGPTのようななんでも理解できる機械を作るために奔走します。
自然言語処理に関する初歩的な技術は本書で一通り抑えることができるため、難しい本を読みたくない方に一冊目としてお勧めします。
株式会社ソルクシーズの事業戦略室のアカウントです。 ジュニアエンジニア向けのお役立ち記事を中心に投稿しています。 採用サイト:solxyz.co.jp/recruit/ 未経験採用も実施中です!
Discussion