【BigQuery】GCSへ大きなデータをエクスポートする方法と注意点

【BigQuery】GCSへ大きなデータをエクスポートする方法と注意点

更新日:2024/07/25

この記事をシェア

  • X
  • Facebook
  • LINE
  • COPY LINK
クリップボードにコピーしました

はじめに

Googleが提供しているGCPにはデータ分析や環境整備に欠かせないサービスが数多く存在しています。
その中でも、今回はBigQueryからGCSへのデータエクスポートで躓いた内容について共有します。

この記事が解決できること

  1. BigQueryからGCSへ1GB以上のデータをエクスポートする方法がわかる
  2. データの分割方法がわかる

BigQueryのデータを分割してGCSに格納する

ファイルの命名方法

GCS格納時のファイル名を指定する際には「ファイル名_*」などのようにワイルドカードを使用します。
これにより、GCS内で自動的に分割されて格納される仕様になっています。

ファイル名_000000000000
ファイル名_000000000001
ファイル名_000000000002
....

※上記のようなファイル名が自動的に割り振られ、格納されます

エクスポートの際の注意点

設定自体はシンプルですが、下記のように作業者の手元でコントロールできないこともあります。

  • エクスポートされるファイルのサイズは一定ではない
  • エクスポートされるファイルの数は指定できない

より詳細について知りたい方は、公式リファレンスも参考にしてください。

データセットのリージョンに関する注意点

  • BigQueryのテーブルが配置されているデータセットのリージョンが US の場合、格納先のGCSバケットのリージョンはどこでもOK
  • データセットのリージョンが US以外 の場合、格納先のGCSバケットのリージョンはBigQueryとそろえる必要がある

まとめ

エクスポート方法自体はそこまで複雑ではないので、初めてGCSへのエクスポートをする人でも簡単に設定ができると思います。
データセットのリージョンについては今回の調査で初めて知ることができたため、今後設定が発生する場合には気を付けていきます。

データ活用でお困りの方へ

私たちDX-Accelerator事業では、データ活用についての様々なスキルを持った人材が常駐でデータ活用支援を行うサービスを提供しています。
当事業はローンチから約3年(24年9月時点)ですが、これまでに様々な業界・業種のお客さまのお手伝いをさせていただいております。

少しでも興味を持ってくださったり、すでにご相談をしたいことがある方はお気軽にご相談ください。現在あなたの組織のフェーズがどこにあるかは関係ありません。まずはお話をしましょう。

もう少しサービスについて知りたい方はサービス紹介資料もご用意しています。

お役立ち資料をご活用ください!

データプロフェッショナルであるDXAメンバーが、業務経験をもとにお役立ち資料を作成しています!
おすすめ3選はこちら!

1.GA4 サンプルレポート|Looker Studio 無料プレゼント
GA4の基本KPIが網羅されたテンプレートです!データを差し替えればすぐにご活用いただけます。

2.サンプル経営ダッシュボード | Tableau無料プレゼント
実際にご提供しているダッシュボードをテンプレート化したものです!是非構成やグラフ選択の参考にしてください。

3.データ活用の部長さん必見!データ活用 内製化の正しい進め方
これまでご支援してきた実績をもとに、データ活用の内製化の進め方を解説しています!組織のDXを担われている方、必読です!

以上、おすすめ3選でした!
すべて無料でダウンロードできますので、お気軽にご利用ください。

この記事をシェア

  • X
  • Facebook
  • LINE
  • COPY LINK
クリップボードにコピーしました

関連記事

DX-Acceleratorについて
より詳しく知りたい方!

DX-Accelerator データ人材常駐支援サービス

即戦力の
アナリティクスエンジニアが
常駐支援!
まずはお気軽にご相談ください。

DX-Acceleratorについて
より詳しく知りたい方!