이 강좌에 대하여

최근 조회 128,990

학습자 경력 결과

12%

가 이 강좌를 수료한 후 새로운 커리어를 시작함
유동적 마감일
일정에 따라 마감일을 재설정합니다.
공유 가능한 수료증
완료 시 수료증 획득
100% 온라인
지금 바로 시작해 나만의 일정에 따라 학습을 진행하세요.
다음 특화 과정의 4개 강좌 중 1번째 강좌:
중급 단계

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

완료하는 데 약 15시간 필요
영어

배울 내용

  • Formalize problems as Markov Decision Processes

  • Understand basic exploration methods and the exploration / exploitation tradeoff

  • Understand value functions, as a general-purpose tool for optimal decision-making

  • Know how to implement dynamic programming as an efficient solution approach to an industrial control problem

귀하가 습득할 기술

Artificial Intelligence (AI)Machine LearningReinforcement LearningFunction ApproximationIntelligent Systems

학습자 경력 결과

12%

가 이 강좌를 수료한 후 새로운 커리어를 시작함
유동적 마감일
일정에 따라 마감일을 재설정합니다.
공유 가능한 수료증
완료 시 수료증 획득
100% 온라인
지금 바로 시작해 나만의 일정에 따라 학습을 진행하세요.
다음 특화 과정의 4개 강좌 중 1번째 강좌:
중급 단계

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

완료하는 데 약 15시간 필요
영어

제공자:

Placeholder

앨버타 대학교

Placeholder

Alberta Machine Intelligence Institute

강의 계획 - 이 강좌에서 배울 내용

콘텐츠 평가Thumbs Up93%(13,718개의 평가)Info
1

1

완료하는 데 1시간 필요

Welcome to the Course!

완료하는 데 1시간 필요
4개 동영상 (총 20분), 2 개의 읽기 자료
완료하는 데 4시간 필요

An Introduction to Sequential Decision-Making

완료하는 데 4시간 필요
8개 동영상 (총 46분), 3 개의 읽기 자료, 2 개의 테스트
2

2

완료하는 데 3시간 필요

Markov Decision Processes

완료하는 데 3시간 필요
7개 동영상 (총 36분), 2 개의 읽기 자료, 2 개의 테스트
3

3

완료하는 데 3시간 필요

Value Functions & Bellman Equations

완료하는 데 3시간 필요
9개 동영상 (총 56분), 3 개의 읽기 자료, 2 개의 테스트
4

4

완료하는 데 4시간 필요

Dynamic Programming

완료하는 데 4시간 필요
10개 동영상 (총 72분), 3 개의 읽기 자료, 2 개의 테스트

검토

FUNDAMENTALS OF REINFORCEMENT LEARNING의 최상위 리뷰

모든 리뷰 보기

강화 학습 특화 과정 정보

강화 학습

자주 묻는 질문

궁금한 점이 더 있으신가요? 학습자 도움말 센터를 방문해 보세요.