About this Course

최근 조회 67,821

학습자 경력 결과

33%

이 강좌를 수료한 후 새로운 경력 시작하기

56%

이 강좌를 통해 확실한 경력상 이점 얻기

33%

급여 인상 또는 승진하기

100% 온라인

지금 바로 시작해 나만의 일정에 따라 학습을 진행하세요.

다음 전문 분야의 7개 강좌 중 4번째 강좌:

유동적 마감일

일정에 따라 마감일을 재설정합니다.

고급 단계

완료하는 데 약 30시간 필요

영어

자막: 영어, 한국어

학습자 경력 결과

33%

이 강좌를 수료한 후 새로운 경력 시작하기

56%

이 강좌를 통해 확실한 경력상 이점 얻기

33%

급여 인상 또는 승진하기

100% 온라인

지금 바로 시작해 나만의 일정에 따라 학습을 진행하세요.

다음 전문 분야의 7개 강좌 중 4번째 강좌:

유동적 마감일

일정에 따라 마감일을 재설정합니다.

고급 단계

완료하는 데 약 30시간 필요

영어

자막: 영어, 한국어

제공자:

국립 연구 고등 경제 대학 로고

국립 연구 고등 경제 대학

강의 계획 - 이 강좌에서 배울 내용

콘텐츠 평가Thumbs Up81%(1,946개의 평가)Info
1

1

완료하는 데 5시간 필요

Intro: why should I care?

완료하는 데 5시간 필요
14개 동영상 (총 85분), 6 readings, 3 quizzes
14개의 동영상
Why should you care9m
Reinforcement learning vs all3m
Multi-armed bandit4m
Decision process & applications6m
Markov Decision Process5m
Crossentropy method9m
Approximate crossentropy method5m
More on approximate crossentropy method6m
Evolution strategies: core idea6m
Evolution strategies: math problems5m
Evolution strategies: log-derivative trick8m
Evolution strategies: duct tape6m
Blackbox optimization: drawbacks4m
6개의 읽기 자료
About the University10m
What you're getting into1m
FAQ10m
Primers1m
About honors track1m
Extras10m
2

2

완료하는 데 3시간 필요

At the heart of RL: Dynamic Programming

완료하는 데 3시간 필요
5개 동영상 (총 54분), 2 readings, 4 quizzes
5개의 동영상
State and Action Value Functions13m
Measuring Policy Optimality6m
Policy: evaluation & improvement10m
Policy and value iteration8m
2개의 읽기 자료
Advanced Reward Design10m
Discrete Stochastic Dynamic Programming10m
3개 연습문제
Reward design8m
Optimality in RL10m
Policy Iteration14m
3

3

완료하는 데 5시간 필요

Model-free methods

완료하는 데 5시간 필요
6개 동영상 (총 47분), 1 reading, 4 quizzes
6개의 동영상
Monte-Carlo & Temporal Difference; Q-learning8m
Exploration vs Exploitation8m
Footnote: Monte-Carlo vs Temporal Difference2m
Accounting for exploration. Expected Value SARSA11m
On-policy vs off-policy; Experience replay7m
1개의 읽기 자료
Extras10m
1개 연습문제
Model-free reinforcement learning10m
4

4

완료하는 데 5시간 필요

Approximate Value Based Methods

완료하는 데 5시간 필요
9개 동영상 (총 104분), 3 readings, 5 quizzes
9개의 동영상
Loss functions in value based RL11m
Difficulties with Approximate Methods15m
DQN – bird's eye view9m
DQN – the internals9m
DQN: statistical issues6m
Double Q-learning6m
More DQN tricks10m
Partial observability17m
3개의 읽기 자료
TD vs MC10m
Extras10m
DQN follow-ups10m
3개 연습문제
MC & TD8m
SARSA and Q-learning8m
DQN12m

검토

PRACTICAL REINFORCEMENT LEARNING의 최상위 리뷰
모든 리뷰 보기

고급 기계 학습 전문 분야 정보

This specialization gives an introduction to deep learning, reinforcement learning, natural language understanding, computer vision and Bayesian methods. Top Kaggle machine learning practitioners and CERN scientists will share their experience of solving real-world problems and help you to fill the gaps between theory and practice. Upon completion of 7 courses you will be able to apply modern machine learning methods in enterprise and understand the caveats of real-world data and settings....
고급 기계 학습

자주 묻는 질문

  • 강좌에 등록하면 바로 모든 비디오, 테스트 및 프로그래밍 과제(해당하는 경우)에 접근할 수 있습니다. 상호 첨삭 과제는 이 세션이 시작된 경우에만 제출하고 검토할 수 있습니다. 강좌를 구매하지 않고 살펴보기만 하면 특정 과제에 접근하지 못할 수 있습니다.

  • 강좌를 등록하면 전문 분야의 모든 강좌에 접근할 수 있고 강좌를 완료하면 수료증을 취득할 수 있습니다. 전자 수료증이 성취도 페이지에 추가되며 해당 페이지에서 수료증을 인쇄하거나 LinkedIn 프로필에 수료증을 추가할 수 있습니다. 강좌 내용만 읽고 살펴보려면 해당 강좌를 무료로 청강할 수 있습니다.

궁금한 점이 더 있으신가요? 학습자 도움말 센터를 방문해 보세요.