
ケモインフォマティクス理論(機械学習編)
無料で読める本
ケモインフォマティクスは日本語では「情報化学」と呼ばれる研究領域であり、より速くより良い判断をするためにデータを解析して体系化することを目指すものです。 学部の有機化学の基礎を習った後に、有機化合物を情報として扱うためにはどのようにしていけば良いのかを理解するためのものです。 この本は、ケモインフォマティクス理論(記述子編)に続く後編になります。ここだけでも学習することができますが、前編も読むことでより体系的に学べると思います。 この本の前編となる化学記述子編については以下で執筆しています。1〜8章については、こちらをご覧ください。 https://zenn.dev/poclabweb/books/chemoinfomatics_theory_descriptor 内容としては、化学情報学(ケモインフォマティクス)でよく使われる以下の内容について記載しております。 9章 化学データの機械学習とデータ分割、回帰と分類の評価指標 10章 化学データの機械学習とモデルの種類について 11章 モデルやデータ及び記述子の解釈と適用範囲の推定 12章 QSPRモデルと融点、溶解度、分配係数 13章 化学構造とスペクトルおよび逆解析 14章 化学空間と食品科学 15章 QSSRモデルと不斉触媒反応と化学記述子 16章 論文の探し方と今後の学び方 で体系的に学べるようにしております。 詳細を学ぶと言うよりも、より深く学ぶためのキッカケになればと思って薄く広く記載しています。各回の最後に自分でコードを動かして確認する演習問題をつけています。 ケモインフォマティクスが日本で少しでもより広がったり、興味をもつ人が増えてくれれば幸いです。 今後、少しずつ随時更新予定です。
Chapters
はじめに(この本は、製作初期段階です)
ここで学ぶことの流れ
◾️9章◾️ 化学データの機械学習とデータ分割、回帰と分類の評価指標
9.0 良いモデル作成のために何が必要なのか
9.1 データ分割(検証と分割方法)
9.2 データの評価(回帰)
9.3 データの評価(分類)
9.5【まとめ】化学データの機械学習とデータ分割、評価(回帰)、評価(分類)
9.6【補足】化学データの機械学習とデータ分割、回帰と分類の評価指標をさらに学ぶためのトピック
9.7【参考文献】化学データの機械学習とデータ分割、回帰と分類の評価指標について
9.8【課題】 課題化学データの機械学習とデータ分割、回帰と分類の評価指標に関する問題
◾️10章◾️ 化学データの機械学習とモデルの種類について
10.0 モデルの概要
10.1 線形モデル
10.2 距離に依存する非線形モデル(距離ベースとサポートベクター)
10.3 非線形モデル(決定木)
10.3 非線形モデル(RFとXGB)
10.5 【まとめ】化学データの機械学習とモデルの種類について
10.6 入れられなかった内容
10.7 【参考文献】化学データの機械学習とモデルの種類について
10.8 【課題】化学データの機械学習とモデルの種類についての問題
◾️11章◾️ モデルの解釈、データや記述子を解釈、モデルの適用範囲を推定
11.0 モデルができた後に考えること
11.1 次元削減(データや記述子を解釈)
11.2 適用範囲を推定
11.3 モデルの解釈
11.3.1 線形回帰の解釈性
11.3.2 決定木の解釈性
11.1.3 汎用的な手法(SHAP)
11.5 【まとめ】モデルの解釈、データや記述子を解釈、モデルの適用範囲を推定
11.6【補足】モデルの解釈、データや記述子を解釈、モデルの適用範囲を推定を、さらに学ぶためのトピック
11.7【参考文献】モデルの解釈、データや記述子を解釈、モデルの適用範囲を推定
11.8【課題】モデルの解釈、データや記述子を解釈、モデルの適用範囲を推定に関する問題
◾️12章◾️ QSPRモデルと融点、溶解度、分配係数
12.0 予測モデルが失敗する理由を考える
12.1 融点予測
12.1.2 融点予測が困難な理由
12.2 水への溶解度予測
12.3 分配係数(水-オクタノール)予測
12.5 【まとめ】QSPRモデルと融点、溶解度、分配係数
12.6 入れられなかった内容
12.7【参考文献】QSPRモデルと融点、溶解度、分配係数を学ぶ
12.8【課題】QSPRモデルと融点、溶解度、分配係数に関する問題
◾️13章◾️ 化学構造とスペクトルおよび逆解析
13.0 スペクトル分析と逆解析の概要
13.1.1 IRの原理
13.1.2 IRの予測
13.2.1 NMRの原理
13.2.2 NMRの予測
13.3 逆解析
13.5【まとめ】化学構造とスペクトルおよび逆解析
13.6 入れられなかった内容
13.7【参考文献】化学構造とスペクトルおよび逆解析
13.8 【課題】化学構造とスペクトルおよび逆解析に関する問題
◾️14章◾️ 化学空間と食品科学
14.0 化学空間と特性空間の探索および活性の崖
14.1 食品科学に関連するデータベース
14.1.3 GDB-13における化合物を列挙する方法
14.2 化学空間の探索と食品科学
14.2.1 MQN
14.2.2 SMIfp(SMILESフィンガープリント)による化学空間
14.2.3 食品化学の空間と化学空間
14.3 構造物性相関(SPR)と活性の崖(Activity Cliff)
14.5 【まとめ】化学空間と食品科学
14.6 入れられなかった内容
14.7 【参考文献】化学空間と食品科学
14.8 【課題】化学空間と食品科学に関する問題
◾️15章◾️ QSSRモデルと不斉触媒反応と化学記述子
15.0 不斉触媒反応とQSSR
15.1 置換基定数を用いるもの
15.2 分子全体のキラリティーの度合いを数値化するもの
15.3 グリッドで表現するもの
15.5 【まとめ】不斉触媒反応とQSSR
15.6 入れられなかった内容
15.7 【参考文献】QSSRモデルと不斉触媒反応と化学記述子
15.8 【課題】QSSRモデルと不斉触媒反応と化学記述子に関する問題
◾️16章◾️ ケモインフォマティクスの今後と学び方など
16.0 今後の展望と学び方など
16.1 これまでの復習
16.2 これからの発展
16.3 講義の学びを活かす
16.5 【まとめ】今後の展望と学び方など
16.6 【入れられなかった内容】今後の展望と学び方など
16.7 【参考文献】今後の展望と学び方など
16.8 【課題】今後の展望と学び方など
◾️あとがき◾️
Community
Author
Topics