🦎

ケモインフォマティクス関連の要素技術まとめ

2021/07/24に公開

参考書籍のまとめはこちら
随時アップデート予定 (*付きは外部リンクです)

データ収集・データ生成

  1. 外部データベースのまとめ

  2. 化合物データベースからの情報取得

  3. スクレイピングで化合物データを試薬サイトから収集する

  4. ベイズ最適化

  5. 量子化学計算

  6. 実験計画法

化学データの取り扱い

  1. 記述子

  2. RDkitの操作

  3. 分子構造の描画

  4. 分子のフラグメント化

  5. 合成難易度の評価

  6. 化学反応

  7. 分子構造の骨格変換など

  8. 分子の3次元構造

  9. 化合物の類似度評価

  10. その他

データの可視化

  1. 相関係数の計算と可視化

  2. 変数のクラスタリングとデンドログラム作成

  3. 自己組織化マップ(Self-Organizing Map, SOM)*

  4. Generative Topographic Mapping (GTM)*

  5. Sparse Generative Topographic Mapping(SGTM)*

  6. 主成分分析の概要とpython実装

  7. 独立成分分析 (Independent Component Analysis, ICA)*

  8. ガウス過程による潜在変数モデル(Gaussian Process Latent Variable Model, GPLVM)*

  9. Matplotlibで3次元の散布図を描画する

  10. t-distributed Stochastic Neighbor Embedding (t-SNE)

仮説検定

  1. マン・ホイットニーのU検定

  2. F検定

  3. 対応のあるt検定

  4. 正規性の検定

  5. 多重検定問題を回避した変数選択(Holm法)

  6. 分散分析

  7. スチューデントのt検定

  8. ウェルチのt検定

  9. ウィルコクソンの符号順位和検定

  10. 無相関検定

  11. 多重検定問題を回避した変数選択(Bonferroni法)

データの前処理

  1. 基本的なデータの前処理

  2. スペクトル・時系列データ

  3. 外れ値検出

変数作成・変数選択

  1. Borutaによる変数選択

  2. 変数変換

  3. Setpwise法による変数選択

  4. GAPLS, GASVR

  5. TIPS, 考え方

  6. 変数のクラスタリングとデンドログラム作成

  7. 欠損値の補完

解析関連

  1. データの分割

  2. その他

回帰手法

  1. 重回帰分析の概要とpython 実装

  2. LASSO回帰・リッジ回帰

  3. 決定木

  4. 勾配ブースティング

  5. ニューラルネットワーク

  6. 混合ガウスモデル

  7. ガウス過程回帰

  8. PLS(部分的最小二乗回帰)*

  9. SVR(サポートベクター回帰)

  10. ランダムフォレスト

    • ランダムフォレスト(RF)*
  11. K最近傍法

  12. TIPS・考え方

  13. その他

分類手法

  1. 線形判別分析

  2. 決定木

  3. K最近傍法

    1. k最近傍法(k-NN)でクラス分類・回帰分析・モデルの適用範囲(適用領域)の設定をしよう*
  4. 勾配ブースティング

  5. ロジスティック回帰

  6. ナイーブベイズ

  7. ランダムフォレスト

    • ランダムフォレスト(RF)*
  8. ニューラルネットワーク

  9. 勾配ブースティング

  10. TIPS・考え方

クラスタリング

  1. 変数のクラスタリングとデンドログラム作成

  2. 混合ガウスモデル (GMM)*

  3. k平均法 (k-means clustering)*

半教師あり学習・転移学習

  1. 半教師あり学習

  2. 転移学習

モデルの検証など

  1. 交差検証

  2. y-randomization

  3. 評価指標(回帰)

  4. オーバーフィッティング(過剰適合)

  5. モデルの適用範囲

最適化

  1. 遺伝的アルゴリズム

  2. ベイズ最適化

逆解析

  1. サンプル生成

    1. GMMを用いたサンプル生成*
  2. 化学構造の生成

  3. モデルの適用範囲

化学関連

  1. 溶解パラメーターについて

  2. ポリマーのガラス転移温度について

プロセス解析

  1. ソフトセンサー

  2. 異常検出・異常診断

その他

  1. 誤差について(メモ)

Discussion