About this Course
최근 조회 73,551

다음 전문 분야의 1개 강좌 중 1번째 강좌:

100% 온라인

지금 바로 시작해 나만의 일정에 따라 학습을 진행하세요.

유동적 마감일

일정에 따라 마감일을 재설정합니다.

고급 단계

완료하는 데 약 39시간 필요

권장: 6 weeks of study, 3-6 hours/week for base track, 6-9 with all the horrors of honors section...

영어

자막: 영어, 한국어

다음 전문 분야의 1개 강좌 중 1번째 강좌:

100% 온라인

지금 바로 시작해 나만의 일정에 따라 학습을 진행하세요.

유동적 마감일

일정에 따라 마감일을 재설정합니다.

고급 단계

완료하는 데 약 39시간 필요

권장: 6 weeks of study, 3-6 hours/week for base track, 6-9 with all the horrors of honors section...

영어

자막: 영어, 한국어

강의 계획 - 이 강좌에서 배울 내용

1
완료하는 데 5시간 필요

Intro: why should i care?

In this module we gonna define and "taste" what reinforcement learning is about. We'll also learn one simple algorithm that can solve reinforcement learning problems with embarrassing efficiency.

...
13 videos (Total 84 min), 8 readings, 3 quizzes
13개의 동영상
Decision process & applications6m
Markov Decision Process5m
Crossentropy method9m
Approximate crossentropy method5m
More on approximate crossentropy method6m
Evolution strategies: core idea6m
Evolution strategies: math problems5m
Evolution strategies: log-derivative trick8m
Evolution strategies: duct tape6m
Blackbox optimization: drawbacks4m
8개의 읽기 자료
What you're getting into1m
Setting up course environment10m
Note: this course vs github course1m
Lecture slides10m
Course teaser placeholder10m
Primers1m
About honors track1m
Extras10m
2
완료하는 데 3시간 필요

At the heart of RL: Dynamic Programming

This week we'll consider the reinforcement learning formalisms in a more rigorous, mathematical way. You'll learn how to effectively compute the return your agent gets for a particular action - and how to pick best actions based on that return.

...
5 videos (Total 54 min), 2 readings, 4 quizzes
5개의 동영상
Policy: evaluation & improvement10m
Policy and value iteration8m
2개의 읽기 자료
Advanced Reward Design10m
Discrete Stochastic Dynamic Programming10m
3개 연습문제
Reward design8m
Optimality in RL10m
Policy Iteration14m
3
완료하는 데 5시간 필요

Model-free methods

This week we'll find out how to apply last week's ideas to the real world problems: ones where you don't have a perfect model of your environment.

...
6 videos (Total 47 min), 1 reading, 4 quizzes
6개의 동영상
Footnote: Monte-Carlo vs Temporal Difference2m
Accounting for exploration. Expected Value SARSA.11m
On-policy vs off-policy; Experience replay7m
1개의 읽기 자료
Extras10m
1개 연습문제
Model-free reinforcement learning10m
4
완료하는 데 5시간 필요

Approximate Value Based Methods

This week we'll learn to scale things even farther up by training agents based on neural networks.

...
9 videos (Total 104 min), 3 readings, 5 quizzes
9개의 동영상
DQN – bird's eye view9m
DQN – the internals9m
DQN: statistical issues6m
Double Q-learning6m
More DQN tricks10m
Partial observability17m
3개의 읽기 자료
TD vs MC10m
Extras10m
DQN follow-ups10m
3개 연습문제
MC & TD8m
SARSA and QLeaning8m
DQN12m
4.1
59개의 리뷰Chevron Right

17%

이 강좌를 수료한 후 새로운 경력 시작하기

44%

이 강좌를 통해 확실한 경력상 이점 얻기

33%

급여 인상 또는 승진하기

Practical Reinforcement Learning의 최상위 리뷰

대학: AKMay 28th 2019

This is one of the Best Course available on Reinforcement Learning. I have gone through various study material but the depth and practical knowledge given in the course is awesome.

대학: FZFeb 14th 2019

A great course with very practical assignments to help you learn how to implement RL algorithms. But it also has some stupid quiz questions which makes you feel confusing.

강사

Avatar

Pavel Shvechikov

Researcher at HSE and Sberbank AI Lab
HSE Faculty of Computer Science
Avatar

Alexander Panin

Lecturer
HSE Faculty of Computer Science

국립 연구 고등 경제 대학 정보

National Research University - Higher School of Economics (HSE) is one of the top research universities in Russia. Established in 1992 to promote new research and teaching in economics and related disciplines, it now offers programs at all levels of university education across an extraordinary range of fields of study including business, sociology, cultural studies, philosophy, political science, international relations, law, Asian studies, media and communicamathematics, engineering, and more. Learn more on www.hse.ru...

고급 기계 학습 전문 분야 정보

This specialization gives an introduction to deep learning, reinforcement learning, natural language understanding, computer vision and Bayesian methods. Top Kaggle machine learning practitioners and CERN scientists will share their experience of solving real-world problems and help you to fill the gaps between theory and practice. Upon completion of 7 courses you will be able to apply modern machine learning methods in enterprise and understand the caveats of real-world data and settings....
고급 기계 학습

자주 묻는 질문

  • 강좌에 등록하면 바로 모든 비디오, 테스트 및 프로그래밍 과제(해당하는 경우)에 접근할 수 있습니다. 상호 첨삭 과제는 이 세션이 시작된 경우에만 제출하고 검토할 수 있습니다. 강좌를 구매하지 않고 살펴보기만 하면 특정 과제에 접근하지 못할 수 있습니다.

  • 강좌를 등록하면 전문 분야의 모든 강좌에 접근할 수 있고 강좌를 완료하면 수료증을 취득할 수 있습니다. 전자 수료증이 성취도 페이지에 추가되며 해당 페이지에서 수료증을 인쇄하거나 LinkedIn 프로필에 수료증을 추가할 수 있습니다. 강좌 내용만 읽고 살펴보려면 해당 강좌를 무료로 청강할 수 있습니다.

궁금한 점이 더 있으신가요? 학습자 도움말 센터를 방문해 보세요.