이 강좌에 대하여

최근 조회 64,890

학습자 경력 결과

33%

가 이 강좌를 수료한 후 새로운 커리어를 시작함

56%

가 이 강좌를 통해 확실한 경력상 이점을 얻음

33%

가 급여 인상 또는 승진 성취
공유 가능한 수료증
완료 시 수료증 획득
100% 온라인
지금 바로 시작해 나만의 일정에 따라 학습을 진행하세요.
다음 특화 과정의 7개 강좌 중 4번째 강좌:
유동적 마감일
일정에 따라 마감일을 재설정합니다.
고급 단계
완료하는 데 약 26시간 필요
영어
자막: 영어, 한국어

학습자 경력 결과

33%

가 이 강좌를 수료한 후 새로운 커리어를 시작함

56%

가 이 강좌를 통해 확실한 경력상 이점을 얻음

33%

가 급여 인상 또는 승진 성취
공유 가능한 수료증
완료 시 수료증 획득
100% 온라인
지금 바로 시작해 나만의 일정에 따라 학습을 진행하세요.
다음 특화 과정의 7개 강좌 중 4번째 강좌:
유동적 마감일
일정에 따라 마감일을 재설정합니다.
고급 단계
완료하는 데 약 26시간 필요
영어
자막: 영어, 한국어

제공자:

국립 연구 고등 경제 대학 로고

국립 연구 고등 경제 대학

강의 계획 - 이 강좌에서 배울 내용

콘텐츠 평가Thumbs Up81%(2,156개의 평가)Info
1

1

완료하는 데 5시간 필요

Intro: why should I care?

완료하는 데 5시간 필요
14개 동영상 (총 85분), 5 개의 읽기 자료, 3 개의 테스트
14개의 동영상
Why should you care9m
Reinforcement learning vs all3m
Multi-armed bandit4m
Decision process & applications6m
Markov Decision Process5m
Crossentropy method9m
Approximate crossentropy method5m
More on approximate crossentropy method6m
Evolution strategies: core idea6m
Evolution strategies: math problems5m
Evolution strategies: log-derivative trick8m
Evolution strategies: duct tape6m
Blackbox optimization: drawbacks4m
5개의 읽기 자료
About the University10m
FAQ10m
Primers1시간
About honors track1m
Extras10m
2

2

완료하는 데 3시간 필요

At the heart of RL: Dynamic Programming

완료하는 데 3시간 필요
5개 동영상 (총 54분), 3 개의 읽기 자료, 4 개의 테스트
5개의 동영상
State and Action Value Functions13m
Measuring Policy Optimality6m
Policy: evaluation & improvement10m
Policy and value iteration8m
3개의 읽기 자료
Optional: Reward discounting from a mathematical perspective10m
External links: Reward Design10m
Discrete Stochastic Dynamic Programming10m
3개 연습문제
Reward design8m
Optimality in RL30m
Policy Iteration30m
3

3

완료하는 데 3시간 필요

Model-free methods

완료하는 데 3시간 필요
6개 동영상 (총 47분), 1 개의 읽기 자료, 4 개의 테스트
6개의 동영상
Monte-Carlo & Temporal Difference; Q-learning8m
Exploration vs Exploitation8m
Footnote: Monte-Carlo vs Temporal Difference2m
Accounting for exploration. Expected Value SARSA11m
On-policy vs off-policy; Experience replay7m
1개의 읽기 자료
Extras10m
1개 연습문제
Model-free reinforcement learning30m
4

4

완료하는 데 3시간 필요

Approximate Value Based Methods

완료하는 데 3시간 필요
9개 동영상 (총 104분), 3 개의 읽기 자료, 5 개의 테스트
9개의 동영상
Loss functions in value based RL11m
Difficulties with Approximate Methods15m
DQN – bird's eye view9m
DQN – the internals9m
DQN: statistical issues6m
Double Q-learning6m
More DQN tricks10m
Partial observability17m
3개의 읽기 자료
TD vs MC10m
Extras10m
DQN follow-ups10m
3개 연습문제
MC & TD10m
SARSA and Q-learning10m
DQN30m

검토

PRACTICAL REINFORCEMENT LEARNING의 최상위 리뷰

모든 리뷰 보기

고급 기계 학습 특화 과정 정보

This specialization gives an introduction to deep learning, reinforcement learning, natural language understanding, computer vision and Bayesian methods. Top Kaggle machine learning practitioners and CERN scientists will share their experience of solving real-world problems and help you to fill the gaps between theory and practice. Upon completion of 7 courses you will be able to apply modern machine learning methods in enterprise and understand the caveats of real-world data and settings....
고급 기계 학습

자주 묻는 질문

  • 강의 및 과제 이용 권한은 등록 유형에 따라 다릅니다. 청강 모드로 강좌를 수강하면 대부분의 강좌 자료를 무료로 볼 수 있습니다. 채점된 과제를 이용하고 수료증을 받으려면 청강 도중 또는 이후에 수료증 경험을 구매해야 합니다. 청강 옵션이 표시되지 않는 경우:

    • 강좌에서 청강 옵션을 제공하지 않을 수 있습니다. 대신 무료 평가판을 사용하거나 재정 지원을 신청할 수 있습니다.
  • 강좌를 등록하면 전문 분야의 모든 강좌에 접근할 수 있고 강좌를 완료하면 수료증을 취득할 수 있습니다. 전자 수료증이 성취도 페이지에 추가되며 해당 페이지에서 수료증을 인쇄하거나 LinkedIn 프로필에 수료증을 추가할 수 있습니다. 강좌 내용만 읽고 살펴보려면 해당 강좌를 무료로 청강할 수 있습니다.

  • 구독하는 경우, 취소해도 요금이 청구되지 않는 7일간의 무료 평가판을 이용할 수 있습니다. 해당 기간이 지난 후에는 환불이 되지 않지만, 언제든 구독을 취소할 수 있습니다. 전체 환불 정책 보기.

  • 예, Coursera에서는 수업료를 낼 수 없는 학습자를 위해 재정 지원을 제공합니다. 왼쪽에 있는 등록 버튼 아래 재정 지원 링크를 클릭하면 지원할 수 있습니다. 신청서를 작성하라는 메시지가 표시되며 승인되면 알림을 받습니다. 성취 프로젝트를 포함하여 전문 분야의 각 강좌에서 이 단계를 완료해야 합니다. 자세히 알아보기.

궁금한 점이 더 있으신가요? 학습자 도움말 센터를 방문해 보세요.