이 강좌에 대하여

최근 조회 121,644
유동적 마감일
일정에 따라 마감일을 재설정합니다.
공유 가능한 수료증
완료 시 수료증 획득
100% 온라인
지금 바로 시작해 나만의 일정에 따라 학습을 진행하세요.
다음 특화 과정의 4개 강좌 중 1번째 강좌:
중급 단계

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

완료하는 데 약 15시간 필요
영어

배울 내용

  • Formalize problems as Markov Decision Processes

  • Understand basic exploration methods and the exploration / exploitation tradeoff

  • Understand value functions, as a general-purpose tool for optimal decision-making

  • Know how to implement dynamic programming as an efficient solution approach to an industrial control problem

귀하가 습득할 기술

Artificial Intelligence (AI)Machine LearningReinforcement LearningFunction ApproximationIntelligent Systems
유동적 마감일
일정에 따라 마감일을 재설정합니다.
공유 가능한 수료증
완료 시 수료증 획득
100% 온라인
지금 바로 시작해 나만의 일정에 따라 학습을 진행하세요.
다음 특화 과정의 4개 강좌 중 1번째 강좌:
중급 단계

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

완료하는 데 약 15시간 필요
영어

제공자:

Placeholder

앨버타 대학교

Placeholder

Alberta Machine Intelligence Institute

강의 계획 - 이 강좌에서 배울 내용

콘텐츠 평가Thumbs Up93%(14,950개의 평가)Info
1

1

완료하는 데 1시간 필요

Welcome to the Course!

완료하는 데 1시간 필요
4개 동영상 (총 20분), 2 개의 읽기 자료
완료하는 데 4시간 필요

An Introduction to Sequential Decision-Making

완료하는 데 4시간 필요
8개 동영상 (총 46분), 3 개의 읽기 자료, 2 개의 테스트
2

2

완료하는 데 3시간 필요

Markov Decision Processes

완료하는 데 3시간 필요
7개 동영상 (총 36분), 2 개의 읽기 자료, 2 개의 테스트
3

3

완료하는 데 3시간 필요

Value Functions & Bellman Equations

완료하는 데 3시간 필요
9개 동영상 (총 56분), 3 개의 읽기 자료, 2 개의 테스트
4

4

완료하는 데 4시간 필요

Dynamic Programming

완료하는 데 4시간 필요
10개 동영상 (총 72분), 3 개의 읽기 자료, 2 개의 테스트

검토

FUNDAMENTALS OF REINFORCEMENT LEARNING의 최상위 리뷰

모든 리뷰 보기

강화 학습 특화 과정 정보

강화 학습

자주 묻는 질문

궁금한 점이 더 있으신가요? 학습자 도움말 센터를 방문해 보세요.