About this Course

최근 조회 39,699

공유 가능한 수료증

완료 시 수료증 획득

100% 온라인

지금 바로 시작해 나만의 일정에 따라 학습을 진행하세요.

다음 전문 분야의 4개 강좌 중 3번째 강좌:

유동적 마감일

일정에 따라 마감일을 재설정합니다.

중급 단계

완료하는 데 약 13시간 필요

영어

자막: 영어

배울 내용

  • U​se the collaborative Databricks workspace and write SQL code that executes against a cluster of machines

  • Use Spark UI to analyze performance and identify bottlenecks

  • Create an end-to-end pipeline that reads data, transforms it, and saves the result

  • B​uild a linear regression model and make predictions using SparkSQL

귀하가 습득할 기술

Data ScienceApache SparkSQL

공유 가능한 수료증

완료 시 수료증 획득

100% 온라인

지금 바로 시작해 나만의 일정에 따라 학습을 진행하세요.

다음 전문 분야의 4개 강좌 중 3번째 강좌:

유동적 마감일

일정에 따라 마감일을 재설정합니다.

중급 단계

완료하는 데 약 13시간 필요

영어

자막: 영어

제공자:

캘리포니아 대학교 데이비스 캠퍼스 로고

캘리포니아 대학교 데이비스 캠퍼스

강의 계획 - 이 강좌에서 배울 내용

1

1

완료하는 데 3시간 필요

Introduction to Spark

완료하는 데 3시간 필요
6개 동영상 (총 32분), 3 readings, 2 quizzes
6개의 동영상
Why Distributed Computing?7m
Spark DataFrames6m
The Databricks Environment8m
SQL in Notebooks3m
Import Data2m
3개의 읽기 자료
A Note From UC Davis10m
Readings and Resources40m
Assignment #1 - Queries in Spark SQL30m
2개 연습문제
Assignment #1 Quiz - Queries in Spark SQL30m
Module 1 Quiz30m
2

2

완료하는 데 2시간 필요

Spark Core Concepts

완료하는 데 2시간 필요
6개 동영상 (총 25분), 2 readings, 2 quizzes
6개의 동영상
Spark Terminology3m
Caching5m
Shuffle Partitions7m
Spark UI3m
Broadcast Joins3m
2개의 읽기 자료
Readings30m
Assignment #2 - Spark Internals30m
2개 연습문제
Assignment #2 Quiz - Spark Internals30m
Module 2 Quiz30m
3

3

완료하는 데 3시간 필요

Engineering Data Pipelines

완료하는 데 3시간 필요
7개 동영상 (총 43분), 2 readings, 2 quizzes
7개의 동영상
Spark as a Connector6m
Accessing Data10m
File Formats8m
Schemas and Types4m
Writing Data6m
Managed and Unmanaged Tables4m
2개의 읽기 자료
Readings1h
Assignment #3 - Engineering Data Pipelines30m
2개 연습문제
Assignment #3 Quiz - Engineering Data Pipelines30m
Module 3 Quiz30m
4

4

완료하는 데 5시간 필요

Machine Learning Applications of Spark

완료하는 데 5시간 필요
7개 동영상 (총 35분), 2 readings, 3 quizzes
7개의 동영상
Applications of Machine Learning4m
Machine Learning Fundamentals6m
Linear Regression6m
Training Linear Regression Model8m
Applying Machine Learning with UDFs4m
Course Summary3m
2개의 읽기 자료
Readings1h
Assignment #4 - Logistic Regression Classifier10m
2개 연습문제
Assignment #4 Quiz - Logistic Regression Classifier30m
Module 4 Quiz30m

검토

DISTRIBUTED COMPUTING WITH SPARK SQL의 최상위 리뷰
모든 리뷰 보기

Learn SQL Basics for Data Science 전문 분야 정보

This Specialization is intended for a learner with no previous coding experience seeking to develop SQL query fluency. Through four progressively more difficult SQL projects with data science applications, you will cover topics such as SQL basics, data wrangling, SQL analysis, AB testing, distributed computing using Apache Spark, and more. These topics will prepare you to apply SQL creatively to analyze and explore data; demonstrate efficiency in writing queries; create data analysis datasets; conduct feature engineering, use SQL with other data analysis and machine learning toolsets; and use SQL with unstructured data sets....
Learn SQL Basics for Data Science

자주 묻는 질문

  • 강좌에 등록하면 바로 모든 비디오, 테스트 및 프로그래밍 과제(해당하는 경우)에 접근할 수 있습니다. 상호 첨삭 과제는 이 세션이 시작된 경우에만 제출하고 검토할 수 있습니다. 강좌를 구매하지 않고 살펴보기만 하면 특정 과제에 접근하지 못할 수 있습니다.

  • 강좌를 등록하면 전문 분야의 모든 강좌에 접근할 수 있고 강좌를 완료하면 수료증을 취득할 수 있습니다. 전자 수료증이 성취도 페이지에 추가되며 해당 페이지에서 수료증을 인쇄하거나 LinkedIn 프로필에 수료증을 추가할 수 있습니다. 강좌 내용만 읽고 살펴보려면 해당 강좌를 무료로 청강할 수 있습니다.

궁금한 점이 더 있으신가요? 학습자 도움말 센터를 방문해 보세요.