📝

[Az-305][勉強メモ]非リレーショナルデータ用にデータ ストレージ ソリューションを設計する

2022/12/24に公開約2,000字

データの種類

構造化データ:リレーショナルデータ。これは言わずもがな。
半構造化データ:Json・yaml・XMLに代表される。1対1の関係が必ずしも存在しないデータ。
非構造化データ:wordといった文書など、データに明確な関係が存在しないデータ。

ストレージアカウントのPremiumとStandardの違い

Standard:HDDベース。汎用的に使われる。コストはPremiumよりも安価。
Premium:SSDベース。高いIOPSやスループットが必要な時。ただしコストは高い。

ストレージアカウントの冗長化方式について

GRSとGZRSの違い:GZRSでは、プライマリリージョンでもZRSと同じような冗長化が実施される。

GRSとRA-GRSの違い:後者は読み取りアクセス専用?とか思ったり。
セカンダリリージョンへのアクセス方法の違いのようである。
GRSの場合、プライマリリージョンがダウンして、セカンダリリージョンにフェイルオーバーしている間はデータへの読み書きができない。
一方で、RA-GRSの場合は、フェールオーバー中も読み取りは実行が可能である。
フェールオーバー後には、GRSもRA-GRSもセカンダリリージョンで読み書きが可能になる。

以下のページが参考になる。
https://jpaztech.github.io/blog/storage/introduction-of-azure-storage-redundancy/

アクセス層についての違い

クール層:データのアクセス頻度は少ないが、すぐにアクセスできるようにはしておきたいとき。
アーカイブ層:データへのアクセス頻度は極めて少ないが、180日以上は保存しておくことが決まっている場合。また、リハイドレードが必要なので、そのリードタイムも懸念がない場合。

不変Blobストレージ

時間ベースのポリシーと、訴訟ベースのポリシーがあるらしい。時間ベースの場合、指定時間が過ぎると削除も上書きもできるのかな…とパッとイメージしたが、上書きはできないらしい。なるほど、本当にデータの改ざんが許されていないファイルに用いられるのだな。

Azure File Sync

Azure Filesはフルマネージド型のクラウドサービスなのに対して、File Syncの場合は、オンプレのファイルサーバとAzure Filesとの同期グループを作成し、ファイルサーバへの変更がFilesにも反映される、オンプレ環境も含めたファイル共有を実現するサービスになる。
以下も参考になる。Azure Filesをマウントして、そこを共有ファイルとして利用するのか、オンプレの複数サーバをFile Syncも使って同期するかといった使い分けだろう。
https://cloudsteady.jp/post/17079/

SSEとCSE

(ここだけAWS) CSEの場合は、クライアント側での暗号化のため、クライアント側で暗号化ロジックを記載する必要がある。

Azure Disk Encryption vs サーバーサイド暗号化

(ここはちゃんとMS)公式によると、SSEのほうが推奨している雰囲気。OSやイメージタイプを選ばなくて良いらしいとのこと。ADEの場合は、ホストOSの機能を使うことになるので、多少の縛りが存在してしまうのだろうと推測。
https://learn.microsoft.com/en-us/azure/virtual-machines/disk-encryption#server-side-encryption-versus-azure-disk-encryption

スループットとIOPSの違い

(毎回調べている気がする…)
IOPS:ディスクへの書き込み・読み取り速度のこと。例えば、大量のデータをコピーするときの速さとか。
スループット:ディスクが転送できる容量のこと。
要は、スループットはどれくらいのデータを転送できるか、流れをあらわすのだと思う。道が広いほど車もたくさん通れるけれど、その車の量を表す。
で、IOPSとはI/Oアクセスのことなので、駐車場の入口・出口のスムーズさを表すと思う。
SSDがETCでHDDが有人案内みたいなイメージで、IOPSが高いほうが、アクセスも効率的になるみたいな。
https://qiita.com/MAKOTO1995/items/21c9be9b7bc39fb4a702

Discussion

ログインするとコメントできます