☁️

s3のビッグデータを rclone で local に mount

2022/10/16に公開

s3など、cloud storage にある ビッグデータをローカルPCに mount

  • この記事は、ポイントのみのメモ書きからスタートしています。修正、補足は随時行います。

想定読者

  • ビッグデータにある数十~数百GのデータをローカルPCにマウントして操作したい人
    • ビッグデータなんで、リモート、ローカルを同期したくないのは当然
  • PCの OS は、windows,linux,mac を想定

rclone を使う --- なぜ?

  • 無料
  • いろんなプロトコルに対応
  • 複数 OS 対応 windows ,Mac,Linux

rclone インストールして使えるようにする

データをS3 にアップして、rclone を設定する

  • 対象となるデータを、s3 にアップ
  • データは、アクセス制限するのが普通
  • IAM をつかって認証用のaccess_keyと secret_key をつくる
  • rclone の設定  参考記事を見ればなんとかなるでしょう。command line の設定なので、少々いらつきます。
  • rclone がちゃんと動いているかの確認
  • rclone lsd <リモートの名前>: これで、見えるトップのバケット一覧がでます。<>は、中身を適宜書き換えてねという意味です。<>を書いてはいけません。実際の例は、こんなです。
    rclone lsd aws-xxx:
  • rclone ls <リモートの名前>:<バケット名> これでバケットの中身の一覧が見れます。

rclone の設定ファイル rclone.conf

  • command line 設定ツールで変更は不便です。設定ファイルは、テキストファイルなので、変更をするときは、エディタでいきなり行うのが楽です。それで設定ファイルのありかです。
  • windows は、<ユーザのホームディレクトリ>\AppData\Roaming\rclone\rclone.conf です。
  • Ubuntu だと、<ユーザのホームディレクトリ>/.config/rclone/rclone.conf です。

mount は、command line で行います。

  • windows ドライブ名でなくてもいけるみたい。--network-mode はいるみたいだが未確認とりあえずつけておくといいでしょう。
    • rclone mount <リモートの名前>:<バケット名> <ドライブ名> --network-mode
  • ubuntu ユーザがアクセスできる空のマウントポイントをつくってマウント
    • rclone mount <リモートの名前>:<バケット名> <マウントポイント>

Discussion