データ パイプラインは通常、Extract-Load(抽出、読み込み)、Extract-Load-Transform(抽出、読み込み、変換)、Extract-Transform-Load(抽出、変換、読み込み)のいずれかの方式に分類されます。このコースでは、どの方式をどのような場合にバッチデータに対して使用すべきかを説明します。また、Google Cloud Platform 上のデータ変換技術(BigQuery など)、Cloud Dataproc での Spark の実行、Cloud Data Fusion でのパイプライン グラフ、Cloud Dataflow によるサーバーレスのデータ処理についても取り上げます。Qwiklabs を使用して、Google Cloud Platform でデータ パイプライン コンポーネントを実際に構築できます。
이 강좌에 대하여
제공자:

Google 클라우드
We help millions of organizations empower their employees, serve their customers, and build what’s next for their businesses with innovative technology created in—and for—the cloud. Our products are engineered for security, reliability, and scalability, running the full stack from infrastructure to applications to devices and hardware. Our teams are dedicated to helping customers apply our technologies to create success.
강의 계획표 - 이 강좌에서 배울 내용
はじめに
このモジュールでは、本コースの内容とアジェンダを紹介します
バッチデータ パイプラインの概要
このモジュールでは、EL、ELT、ETL というデータ読み込み方式と、各方式をどのような場合に使うべきかを確認します
Cloud Dataproc での Spark の実行
このモジュールでは、Cloud Dataproc で Hadoop を実行する方法、GCS の活用法、Dataproc ジョブを最適化する方法を説明します。
Cloud Data Fusion と Cloud Composer によるデータ パイプライン管理
このモジュールでは、Cloud Data Fusion と Cloud Composer を使ってデータ パイプラインを管理する方法を説明します。
Cloud Dataflow によるサーバーレスのデータ処理
このモジュールでは、Cloud Dataflow を使ったデータ処理パイプライン構築を取り上げます。
まとめ
このモジュールでは、本コースで学んだトピックを復習します
자주 묻는 질문
등록 전에 강좌를 미리 볼 수 있나요?
등록하면 무엇을 이용할 수 있나요?
강좌 수료증을 언제 받게 되나요?
이 강좌를 청강할 수 없는 이유는 무엇인가요?
궁금한 점이 더 있으신가요? 학습자 도움말 센터를 방문해 보세요.