👜

Google ColabでGCSをマウントする

2021/02/03に公開

小ネタだが毎回忘れるので…。GCSに置いてあるデータをGoogle Colabから参照したい時がある。こういうときはgcsfuseを使ってマウントできる。

まずGCPの認証。以下のコードで認証コードの入力を求められるので、実行結果のリンクから飛んでコピーして入力。

from google.colab import auth
auth.authenticate_user()

認証に成功したらgcsfuseのインストール

!echo "deb http://packages.cloud.google.com/apt gcsfuse-`lsb_release -c -s` main" | sudo tee /etc/apt/sources.list.d/gcsfuse.list
!curl https://packages.cloud.google.com/apt/doc/apt-key.gpg | sudo apt-key add -
!apt-get -y -q update
!apt-get -y -q install gcsfuse

あとはGCSのバケットをマウント

! mkdir -p ${DIRECTORY}
! gcsfuse --implicit-dirs --limit-bytes-per-sec -1 --limit-ops-per-sec -1 ${BUCKET} ${DIRECTORY}

Discussion