Open5

AWS EMRのオプション周りを調べる

i-hrmi-hrm

https://docs.aws.amazon.com/ja_jp/AWSCloudFormation/latest/UserGuide/aws-properties-elasticmapreduce-cluster-spotprovisioningspecification.html

BlockDurationMinutes

スポットインスタンス(スポットブロックとも呼ばれる)の定義された期間(分)。指定すると、定義された期間が終了する前にSpot Instanceが終了することはなく、Spot Instanceの定義された期間の価格が適用されます。有効な値は、60、120、180、240、300、または360です。継続期間は、Spot InstanceがインスタンスIDを受け取るとすぐに開始されます。期間が終了すると、Amazon EC2はSpot Instanceを終了するようマークし、Spot Instance termination notice(インスタンスが終了する前に2分間の警告を与える)を提供します。

i-hrmi-hrm

https://docs.aws.amazon.com/ja_jp/AWSEC2/latest/UserGuide/spot-requests.html#fixed-duration-spot-instances

期間が定義されたスポットインスタンス (スポットブロックとも呼ばれます) は、2021 年 7 月 1 日以降の新規のお客様は、ご利用いただけません。既に、期間が指定されたスポットインスタンスを使用した経験をお持ちのお客様については、2022 年 12 月 31 日まで、この機能を引き続きサポートいたします。

返信元のdocumentが古いかはわからないが、期間指定は出来なくなる模様

i-hrmi-hrm

スポットインスタンスはEC2のオプション
EMRはEC2をクラスタリングして使用しているので、それを操作していると思われる

https://docs.aws.amazon.com/ja_jp/AWSEC2/latest/UserGuide/using-spot-instances.html

Spot Instance

スポットインスタンスは、休止中の EC2 キャパシティーを使用するインスタンスで、オンデマンド価格より低料金で利用できます。スポットインスタンス では未使用の EC2 インスタンスを静止状態割引でリクエストできるため、Amazon EC2 のコストを大幅に削減できます。 スポットインスタンスの時間料金は、スポット料金と呼ばれます。各アベイラビリティーゾーンにおける各インスタンスタイプのスポット料金は、Amazon EC2 によって設定され、スポットインスタンス の長期的な需給に基づいて徐々に調整されます。スポットインスタンス は、利用可能なキャパシティーが存在し、リクエストの 1 時間あたりの上限価格がスポット料金より高い場合に実行されます。

i-hrmi-hrm

https://aws.amazon.com/jp/emr/faqs/

正規化インスタンス時間

Q: コンソールに表示される正規化インスタンス時間はどのように計算されますか?

AWS マネジメントコンソールで、各クラスターには正規化インスタンス時間の欄があります。ここにはクラスターが使用したコンピューティング時間の概数が切り上げて表示されます。

正規化インスタンス時間とはコンピューティングに利用した時間で、m1.small の 1 時間の使用を 1 標準処理時間として計算されます。各インスタンスファミリーでの異なるサイズ、および、それらに対応した 1 時間ごとの正規化ファクターの一覧は、こちらのドキュメントでご確認いただけます。
例えば、10 ノードの r3.8xlarge クラスターを 1 時間実行した場合、コンソールに表示される正規化インスタンス時間の合計数は 640 (10 (ノード数) x 64 (正規化係数) x 1 (クラスターを実行した時間数) = 640) となります。

これは概算値であり、請求目的で使用されるものではありません。請求の対象となる Amazon EMR の使用量については、請求とコスト管理コンソールをご覧ください。

i-hrmi-hrm

インスタンス数とEMRの料金について調べる

https://media.amazonwebservices.com/jp/wp/AWS_Amazon_EMR_Best_Practices.pdf

要約すると、Amazon EMR インスタンスの適正な数は、データをどれだけ迅速に処理する必要があり、データの処理時間要件にどれだけの金額を支払うかによって決まります。Amazon EMR の料金は 1 時間単位で発生します。つまり、ジョブの実行に 1 時間かからなかった場合でも、1 時間分の EC2 利用料金が請求されます。したがって、コストを削減するには、Amazon EMR インスタンスの数を減らして、処理時間を短縮することをお勧めします。