【GCS】GCSフォルダ内の複数ファイルを一括ダウンロードする方法

【GCS】GCSフォルダ内の複数ファイルを一括ダウンロードする方法

更新日:2024/05/23

この記事をシェア

  • X
  • Facebook
  • LINE
  • COPY LINK
クリップボードにコピーしました

はじめに

GCSは大量のデータを保管しておくのに適したツールですが、GUI操作ではGCS上のフォルダをまるごとダウンロードすることができません(2024/03/27現在)。


そのため今回はCLIを用いてファイルの一括ダウンロードを行う方法を模索しました。

注意点

本記事の内容はWindows向けの手順です。macOSの場合別の手順になりますのでご注意ください。

Google Cloud CLIを用いたダウンロードの手順

①Google Cloud CLI のインストール

Google Cloud CLI インストーラをダウンロードします。

インストーラを起動し以下手順でインストールを進めていきます。

  1. Nextを選択
  2. I Agreeをクリック
  3. ALL usersにチェックをしてNextを選択
  4. Nextをクリック(インストールする場所を変更する場合は、フォルダーを変える)
  5. Installを選択(インストールするコンポーネントを変更する場合はチェックを変える)
  6. Nextをクリック
  7. Finishを選択(初期設定gcloud initが自動で始まる)

②初期設定を行う

以下の手順に沿って初期設定を行います。

1. ログインするか尋ねられるため、「Y」を押す
2. GCS権限のあるアカウントでログイン
3. 「1」を入力しプロジェクトIDでのログインを選択

4. プロジェクトIDを入力

5. 「Y」を押し、数字を入力でリージョンを選ぶ

6. gsutil lsを実行
 以下のようにプロジェクト内のデータセットが表示されていれば、正しいプロジェクト内にアクセスができています。

③ダウンロード

指定プロジェクト内で以下コマンドを実行しダウンロードします。

gsutil -m cp -r "gs://your_dataset_name/object_name/folder_name"  "C:\\Users\\xxxx\\Desktop\\xxxx."

ダウンロードのコマンド

上記のコマンドをカスタマイズするときは

  • gs://[データセット名]/[オブジェクト名]/[フォルダ名] → GCS内のアドレス
  • C:\\Users\\xxxx\\Desktop\\xxxx  → 所定のダウンロード場所

にそれぞれ変更してください。

GCS内のフォルダアドレス入手方法

取得したいフォルダのアドレスが分からないときは、下記の方法で入手できます。

1.GCS上でダウンロードしたいフォルダにチェックを入れる



2.ダウンロードボタンを押すと、以下のポップアップからアドレスをコピーできる

④実行結果

サンプルアドレスをそのまま実行すると指定先のフォルダ下に以下フォルダとファイルが作成されます。

test_folder
└ test_file1.csv
└ test_file2.csv

データ活用支援のお知らせ

データ活用でお困りの方へ

私たちDX-Accelerator事業では、データ活用についての様々なスキルを持った人材が常駐でデータ活用支援を行うサービスを提供しています。
当事業はローンチから約2年(24年2月時点)ですが、これまでに様々な業界・業種のお客さまのお手伝いをさせていただいております。

少しでも興味を持ってくださったり、すでにご相談をしたいことがある方はお気軽にご相談ください。現在あなたの組織のフェーズがどこにあるかは関係ありません。まずはお話をしましょう。

もう少しサービスについて知りたい方はサービス紹介資料もご用意しています。

この記事をシェア

  • X
  • Facebook
  • LINE
  • COPY LINK
クリップボードにコピーしました

カテゴリから記事を探す

データエンジニアの呟き

オウンドメディア分析

アクセスログ分析

施策効果分析

関連記事

DX-Acceleratorについて
より詳しく知りたい方!

DX-Accelerator データ人材常駐支援サービス

即戦力の
アナリティクスエンジニアが
常駐支援!
まずはお気軽にご相談ください。

DX-Acceleratorについて
より詳しく知りたい方!