20221202-Amazon SageMaker Geospatial ML
■当記事について
re:inventで新しくSageMakerの機能として発表されたGeospatial MLを試してみようというモノです。
■キーワード
ラスターデータ
ドットで出来た画像データ
ベクターデータ
線で出来た画像データ
地理空間データ
地表の形状を表すデータであり、点、線、多角形などの2次元の幾何学的形状を用いて道路や土地の境界などを表現するベクターデータと、人工衛星や航空機、リモートセンシングなどで撮影された画像などを表現するラスターデータの2種類がある
■SageMakerの地理空間を使う理由
SageMaker の地理空間機能を使用すると、DIY ソリューションよりも迅速に地理空間データに関する予測を行うことができます。SageMaker の地理空間機能を使用すると、既存の顧客データレイク、オープンソースデータセット、および他の SageMaker 地理空間データプロバイダから地理空間データに簡単にアクセスできるようになります。
■Amazon SageMaker Geospatial MLの機能
- 地球観測の仕事 : 衛星画像データを取得、変換、可視化し、予測を立て、有用な洞察を得る。
- ベクターエンリッチメントジョブ : CSVファイルから地理座標を読み取り可能な住所に変換するなどの操作で、データをエンリッチします。
- 地図の可視化 : CSV、JSON、GeoJSONファイルからアップロードされた衛星画像や地図データを可視化します。
■やってみる(地球観測の仕事)
環境構築(notebook)
SageMaker Studio notebook起動
InterFaceが変わっとる
notebook起動
環境設定
Image : Geospatial 1.0
Instance type : ml.m5.4xlarge
ジョブ選択
タブからGeospatial -> Earth Observation jobs -> Create job
モデル選択
Aolファイルを準備しUpload
AoI(Area of Interest)のファイルをローカルで準備 aol.geojson
シアトルのAoIです
{
"type": "Polygon",
"coordinates": [
[
[-122.4258, 47.5116],
[-122.2459, 47.5116],
[-122.2459, 47.7429],
[-122.4258, 47.7429],
[-122.4258, 47.5116]
]
]
}
準備したファイルをUpload
日付や雲量率を選択
選択範囲で濃淡が変わる、スクショしていないが下にCreateボタンがあるので押下
JOBが起動する
約30分で完了
期間を短くしたら変わるかなと思ったけど、結局は30分ですね
- 期間:1ヶ月 & Cloud coverage:0%-20% -> 28m 43s
- 期間:1ヶ月 & Cloud coverage:0%-100% -> 28m 47s
- 期間:0.5ヶ月 & Cloud coverage:0%-100% -> 27m 12s
入力データ
期間:1ヶ月 & Cloud coverage:0%-20%
期間:1ヶ月 & Cloud coverage:0%-100%
期間:0.5ヶ月 & Cloud coverage:0%-100%
入力された衛星画像から土地利用状況を検出するレンダリング処理で出力されたジョブ結果
黄色い部分は海、緑は雲、濃いオレンジは森林、オレンジは陸地です。
雲があると分析が正しく行えないようです
あと一部表示地域があるのは不明.しかし画面切り替えが結構重い、ローカル端末のリソースは食ってないのでインスタンスサイズが悪いの?
期間:1ヶ月 & Cloud coverage:0%-20%
期間:1ヶ月 & Cloud coverage:0%-100%
期間:0.5ヶ月 & Cloud coverage:0%-100%
■操作の種類
今回はUIで準備したけどnotebookで実施するともっと多くの操作が可能なようです
■課題
notebook操作でbotocoreでの"search_raster_data_collection"がエラー吐いてちゃんと操作できなかったので、SDKは別途調査
Discussion