外部ライブラリとカーネルのインストール

ノートブックインスタンスのすべてのパッケージはSageMaker AIで利用するためにライセンスされており、追加の商用ライセンスは必要ない
- 将来変更される可能性はあるため、更新についてはライセンス条件を定期的に見直すことを推奨する
ノートブックインスタンスにはscikit,Pandas,NumPy,TensorFlow,MXNetなどのJupyterカーネルとPythonパッケージが含まれており、インスタンスを停止・起動すると更新される
インスタンス内の異なるJupyterカーネルは、別々のconda環境
カスタム環境とカーネルとEBSにインストールすることで、インスタンスを停止・起動したときにそれらが維持し、インストールした外部ライブラリがSageMaker AIによって更新されないようにする
- これを行うには、インスタンス作成時に実行されるスクリプト（on-create）と、インスタンスを再起動するときに実行されるスクリプト（on-start）の両方を含むライフサイクル設定を使用する
パッケージインストールツール
- conda install
- pip install
パッケージのインストール方法
- ライフサイクル設定スクリプト
- ノートブック（次のコマンドがサポート）
  - %conda install
  - %pip install
- Jupyterターミナル
ノートブック内ではシステムコマンド構文（!で始まる）を使って !pip install のようにパッケージをインストールできる
%pip、%conda のコマンドでは、使用中の環境やインタプリタを正しく考慮するため、ノートブックからパッケージをインストールする推奨の方法
Conda
- SageMaker AI ではデフォルトチャネルとconda-forgeチャネルのいずれかの使用をサポート
- Condaが依存関係グラフを解決する方法により、conda-forgeからのパッケージのインストールにかなり長い時間がかかる場合がある（10分以上）
- Deep Learning AMI には多数のconda環境やパッケージがプリインストールされており、「環境に一貫性がありません。パッケージプランを慎重に確認してください」という警告が表示される場合があるが、この警告にかかわらずSageMaker AI は、SageMaker AIが提供するすべての環境が正しいことを保証する
  - ユーザーがインストールしたパッケージが正しく機能することを保証できない
- SageMaker AI、AWS Deep Learning AMI、EMRのユーザーは、Anacondaを使用する場合、2024.2.1まで商用ライセンスを取得せずに商用Anacondaリポジトリにアクセスできる
  - 2024.2.1以降、商用Anacondaリポジトリを使用する場合は、お客様が独自のAnacondaラインセンス要件を決定する責任がある
- 環境をアクティブ化する2つの方法
  - conda activate/deactivate
  - source activate/deactivate
- SageMaker AI は、インスタンスが停止しても保持されるConda環境をEBSに移動することをサポート
  - 環境がルートボリュームにインストールされている場合、環境は保持されない
- サポートされているconda操作
  - 単一環境でのパッケージインストール
  - すべての環境でのパッケージインストール
  - R環境でのRパッケージインストール
  - メインのcondaリポジトリからパッケージインストール
  - conda-forgeからパッケージインストール
  - EBSを使用するためにCondaのインストール場所を変更
  - conda activateとsource activateの両方をサポート
Pip
- Pythonパッケージをインストール・管理するためのデファクトツール
- デフォルトでPythonパッケージインデックス（PyPI）でパッケージを検索
- PyPIの代わりに代替パッケージリポジトリを利用できる
- サポートされているPip操作
  - アクティブなconda環境なしでpipを使用してパッケージをインストールする
    - システム全体にパッケージをインストールする
  - pipを使用してconda環境にパッケージをインストールする
  - pipを使用してすべてのconda環境にパッケージをインストールする
  - EBSを使用するためにpipのインストール場所を変更する
  - 代替リポジトリを使用してpipでパッケージをインストールする
サポートされいないこと
- パッケージがSageMaker AIまたはDLAMIによってインストールされ、これらのパッケージに対して次の操作を行うと、ノートブックインスタンスが不安定になる可能性がある
  - アンインストール
  - ダウングレード
  - アップグレード
- ネットワークの構成やcondaやPyPIの可用性に関する潜在的な問題により、パッケージが一定または確率的な時間内にインストールされていることは保証できない

はじめに

SageMaker ノートブックインスタンス

ノートブックインスタンスと使用してモデルを構築するためのチュートリアル

ノートブックインスタンスを作成する（チュートリアル）

ノートブックインスタンスにJupyterノートブックを作成（チュートリアル）

データセットを準備（チュートリアル）

モデルをトレーニングする（チュートリアル）

モデルをEC2にデプロイする（チュートリアル）

モデルを評価する（チュートリアル）

ノートブックインスタンスのリソースをクリーンアップ（チュートリアル）

Amazon Linux2ノートブックインスタンス

JupyterLab のバージョン管理

ノートブックインスタンスを作成する

ノートブックインスタンスにアクセスする

ノートブックインスタンスを更新する

LCCスクリプトを使用したノートブックインスタンスのカスタマイズ

外部ライブラリとカーネルのインストール

ノートブックインスタンスのソフトウェア更新

ノートブックを使用して EMR Spark インスタンスを制御する

SageMaker AI ノートブックインスタンスにGitリポジトリを関連づける

ノートブックインスタンスのメタデータ

JupyterログをCloudWatch ログから確認