About this Course
최근 조회 63,897

다음 전문 분야의 4개 강좌 중 4번째 강좌:

100% 온라인

지금 바로 시작해 나만의 일정에 따라 학습을 진행하세요.

유동적 마감일

일정에 따라 마감일을 재설정합니다.

중급 단계

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

완료하는 데 약 9시간 필요

권장: 4-6 hours/week...

영어

자막: 영어

귀하가 습득할 기술

Artificial Intelligence (AI)Machine LearningReinforcement LearningFunction ApproximationIntelligent Systems

다음 전문 분야의 4개 강좌 중 4번째 강좌:

100% 온라인

지금 바로 시작해 나만의 일정에 따라 학습을 진행하세요.

유동적 마감일

일정에 따라 마감일을 재설정합니다.

중급 단계

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

완료하는 데 약 9시간 필요

권장: 4-6 hours/week...

영어

자막: 영어

강의 계획 - 이 강좌에서 배울 내용

1
완료하는 데 1시간 필요

Welcome to the Final Capstone Course!

2개 동영상 (총 10분), 2 readings
2개의 동영상
Meet your instructors!8m
2개의 읽기 자료
Reinforcement Learning Textbook10m
Pre-requisites and Learning Objectives10m
2
완료하는 데 1시간 필요

Milestone 1: Formalize Word Problem as MDP

4개 동영상 (총 23분)
4개의 동영상
Andy Barto on What are Eligibility Traces and Why are they so named?9m
Let's Review: Markov Decision Processes6m
Let's Review: Examples of Episodic and Continuing Tasks3m
3
완료하는 데 1시간 필요

Milestone 2: Choosing The Right Algorithm

7개 동영상 (총 40분), 1 quiz
7개의 동영상
Let's Review: Expected Sarsa3m
Let's Review: What is Q-learning?3m
Let's Review: Average Reward- A New Way of Formulating Control Problems10m
Let's Review: Actor-Critic Algorithm5m
Csaba Szepesvari on Problem Landscape8m
Andy and Rich: Advice for Students5m
1개 연습문제
Choosing the Right Algorithm
4
완료하는 데 1시간 필요

Milestone 3: Identify Key Performance Parameters

4개 동영상 (총 25분), 1 quiz
4개의 동영상
Let's Review: Non-linear Approximation with Neural Networks4m
Drew Bagnell on System ID + Optimal Control6m
Susan Murphy on RL in Mobile Health7m
1개 연습문제
Impact of Parameter Choices in RL40m
4.6
9개의 리뷰Chevron Right

A Complete Reinforcement Learning System (Capstone)의 최상위 리뷰

대학: SANov 9th 2019

Excellent final course for the specialization. Moon Lander project was informative and fun.

강사

Avatar

Martha White

Assistant Professor
Computing Science
Avatar

Adam White

Assistant Professor
Computing Science

앨버타 대학교 정보

UAlberta is considered among the world’s leading public research- and teaching-intensive universities. As one of Canada’s top universities, we’re known for excellence across the humanities, sciences, creative arts, business, engineering and health sciences....

Alberta Machine Intelligence Institute 정보

The Alberta Machine Intelligence Institute (Amii) is home to some of the world’s top talent in machine intelligence. We’re an Alberta-based research institute that pushes the bounds of academic knowledge and guides business understanding of artificial intelligence and machine learning....

강화 학습 전문 분야 정보

The Reinforcement Learning Specialization consists of 4 courses exploring the power of adaptive learning systems and artificial intelligence (AI). Harnessing the full potential of artificial intelligence requires adaptive learning systems. Learn how Reinforcement Learning (RL) solutions help solve real-world problems through trial-and-error interaction by implementing a complete RL solution from beginning to end. By the end of this Specialization, learners will understand the foundations of much of modern probabilistic artificial intelligence (AI) and be prepared to take more advanced courses or to apply AI tools and ideas to real-world problems. This content will focus on “small-scale” problems in order to understand the foundations of Reinforcement Learning, as taught by world-renowned experts at the University of Alberta, Faculty of Science. The tools learned in this Specialization can be applied to game development (AI), customer interaction (how a website interacts with customers), smart assistants, recommender systems, supply chain, industrial control, finance, oil & gas pipelines, industrial control systems, and more....
강화 학습

자주 묻는 질문

  • 강좌에 등록하면 바로 모든 비디오, 테스트 및 프로그래밍 과제(해당하는 경우)에 접근할 수 있습니다. 상호 첨삭 과제는 이 세션이 시작된 경우에만 제출하고 검토할 수 있습니다. 강좌를 구매하지 않고 살펴보기만 하면 특정 과제에 접근하지 못할 수 있습니다.

  • 강좌를 등록하면 전문 분야의 모든 강좌에 접근할 수 있고 강좌를 완료하면 수료증을 취득할 수 있습니다. 전자 수료증이 성취도 페이지에 추가되며 해당 페이지에서 수료증을 인쇄하거나 LinkedIn 프로필에 수료증을 추가할 수 있습니다. 강좌 내용만 읽고 살펴보려면 해당 강좌를 무료로 청강할 수 있습니다.

궁금한 점이 더 있으신가요? 학습자 도움말 센터를 방문해 보세요.