Open1
研究お役立ちまとめ(ディレクトリ構成編)
ディレクトリ構成について
AI / Data science系統の研究を行なっていく上で、使ったプログラムコードや処理したデータ、学習済みモデルの管理は非常に重要である。しかし、初心者のうちはどのようにしたら上手く整理できるのかの見通しも立てにくいだろう(そして混沌としたディレクトリがうまれ、データを上書きしてしまったり、ということがしばしば起こる)。そのような時は以下を参考にテンプレート的にディレクトリ構成を作ってしまうと良い。もちろん正解はないのだが、よくあるディレクトリ構成を把握しておくことは先行研究の実装を理解する上でも役立つ。
Coockiecutter Data Science
古くからあるData Science系のディレクトリテンプレートである。最近、Version2がリリースされアップデートが続いている。モデルの学習用というよりも、学習後の分析・整理テンプレートとして優れているような印象がある(Version 1の時はsrcディレクトリも存在していたが、V2ではなくなっている)。詳細および使い方は以下のドキュメントを確認してほしい。
新しいPython Projectの場合
最も有名で、昔からあるPython Project推奨ディレクトリ構成は"The Hitchhiker's Guide to Python"に記載されているものだろう。ありがたいことに日本語訳がWEBで公開されている!