Closed11

RDSのOracleにGlueのdata connectionで接続してデータを吸い出す

カイト@データ基盤屋カイト@データ基盤屋

「S3のエンドポイントは設定済み…というかデフォルトで作られているっぽいのに…」と思ってよく見ていたら、「エンドポイントタイプ」が「Interface」になっていた。

Interface になっている

カイト@データ基盤屋カイト@データ基盤屋
  • Blueprint Type: Database Snapshot
  • Database connection: 記事の「3. AWS Glue 接続を作成する」で設定したものを流用
  • Source data path: Crawlerに設定した、 [database名]/%
  • Import Target: インポート先のGlue Data Catalogのデータベースを選ぶ
  • Target storage location: S3の適当な場所を選ぶ(抽出したデータが保存される)
  • Data format: 基本的には列志向で扱いたいのでParquet。よほど軽いDBだとか、人の目で生のデータチェックする機会が多いだとかがあればCSVでもいいかもしれない。
  • Import frequency: 今回はRun on demand
  • Workflow name: 好きなものを
  • IAM role: 記事の「1. AWS Glue が引き受ける IAM ロールを作成する」で作成したものを流用する
    • が、このままだと「PassRole」の権限が足りないので追加する
      • 一度何もせずにWorkflowをCreateするとわかりやすいエラーメッセージが出るので、それに従えばOK
  • Maximum capacity: 用途に合わせて 今回は設定なし
  • Concurrency: 用途に合わせて 今回は1
このスクラップは2024/01/31にクローズされました