AWS SageMakerノートブックでの削除済ファイルの復旧方法

2024/11/01に公開

こんにちは、株式会社ナレッジラボでAI・機械学習のエンジニアリングを担当しているダンです。私たちは、社内に散在する経営データの集計・分析・管理を支援する「Manageboard」というサービスを提供しています。Manageboardは、今後ますますAI機能を強化していく予定です。私の記事では、研究開発中に直面した課題とその解決策について共有いたします。

ファイル削除のリスク

機械学習のモデルやアルゴリズムを検証するために、AWSのSageMakerは頻繁に利用されるサービスの一つです。しかし、SageMakerノートブック上でJupyterLabを利用する際、重いタスクを実行すると遅延が発生することがよくあります。この遅延によって、作業が滞ったり、重要なファイルを誤って削除してしまうリスクが高まります。特に、ファイル削除に関するトラブルは多くのユーザーが直面する問題です。

重いタスクの実行時に遅延が発生する原因はいくつかあります。計算リソースの不足、データの読み込み速度、さらには他のプロセスとの競合などが考えられます。これらの要因は、特に大規模なデータセットを扱う場合に顕著になります。ユーザーは、タスクの実行が終わるのを待つ間、他の作業に移ることができず、注意力が散漫になることがあります。

タスクの遅延が発生している状態では、ファイルの管理が難しくなります。特に、誤って重要なファイルを削除するリスクが増します。多くの情報源では、削除されたファイルを回復するために~/.local/share/Trash/files/ディレクトリを確認することを推奨しています。しかし、私たちの環境ではこのディレクトリが存在しません。

代替手段の発見

そこで、削除したファイルを保持する別のディレクトリ~/SageMaker/.Trash-1000/files/を見つけました。このディレクトリを利用することで、誤って削除したファイルを簡単に復元できます。具体的な手順は以下の通りです。

  1. ターミナルを開く:SageMakerノートブックのターミナルを起動します。
  2. Trashディレクトリに移動:次のコマンドを入力して、削除されたファイルが格納されているディレクトリに移動します。
   cd ~/SageMaker/.Trash-1000/files/
  1. ファイルを確認:削除されたファイルのリストを表示します。
   ls
  1. ファイルを復元:必要なファイルを見つけたら、元の場所にコピーします。
   mv [filename] ~/SageMaker/

まとめ

SageMakerノートブックでの作業は非常に強力ですが、遅延やファイル管理に関する課題が伴うことがあります。特に、重いタスクを実行中にファイルを誤って削除してしまうと、作業の進行に大きな影響を与えることがあります。しかし、~/SageMaker/.Trash-1000/files/という代替手段を利用することで、削除されたファイルを簡単に復元することができます。この情報が、同じ問題に直面している他のユーザーにも役立つことを願っています。

Discussion