본문 영역으로 바로가기
KoreaUnivK:
ku_ai_002
강화학습의 수학적 기초와 알고리듬 이해
분류 탐색
인문
자연
사회
의약
예체능
공학
융ㆍ복합
블루 리본
4차 산업혁명
AI 인공지능
전체 강좌 보기 +
언어 선택
English
한국어 (대한민국)
분류 탐색
인문
자연
사회
의약
예체능
공학
융ㆍ복합
블루 리본
4차 산업혁명
AI 인공지능
전체 강좌 보기 +
닫기
로그인
회원가입
Kor
Eng
로그인
K-MOOC 소개
K-MOOC란?
추진체계
참여기관
강좌찾기
분야별 강좌
묶음강좌
학점은행과정
커뮤니티
공지사항
뉴스
자료실
FAQ
K-MOOC에 바라는점
K-MOOC 소개
K-MOOC란?
추진체계
참여기관
강좌찾기
분야별 강좌
묶음강좌
학점은행과정
커뮤니티
공지사항
뉴스
자료실
FAQ
K-MOOC에 바라는점
TOP
경고:
현재 사용중인 브라우저는 지원하지 않습니다.
Chrome
나
Firefox
를 사용하는 것을 권장합니다.
본 강좌 학습을 위해서는
로그인
을 하시거나
회원가입
을 해주세요.
강좌
강의 영상
, current location
강화학습의 수학적 기초와 알고리듬 이해
모두 펼치기
Week 1. 강화학습의 이해
1.1 강화학습 개요
강화학습 개요
시청
1.2 Multi-armed Bandit 문제
Multi-armed Bandit 문제
시청
1.3 강화학습 맛보기
강화학습 맛보기
시청
Week 2. 동적계획법-1
2.1 문제해결전략과 동적 계획법
문제해결전략과 동적 계획법
시청
2.2 동적 계획법의 주요개념(1) 최적화의 원리
동적 계획법의 주요개념(1) 최적화의 원리
시청
2.3 동적 계획법의 주요개념(2) 중첩되는 부분문제와 역진귀납법
동적 계획법의 주요개념(2) 중첩되는 부분문제와 역진귀납법
시청
Week 3. 동적계획법-2
3.1 최단거리 문제(Shortest Path)
최단거리 문제(Shortest Path)
시청
3.2 방문판매원 문제(Traveling Salesman Problem, TSP)
방문판매원 문제(Traveling Salesman Problem, TSP)
시청
3.3 배낭문제 (Knapsack Problem)
배낭문제(Knapsack Problem)
시청
Week 4. 마르코브 과정
4.1 마르코브 프로세스 개요
마르코브 프로세스 개요
시청
4.2 마르코브 프로세스 예시
마르코브 프로세스 예시
시청
4.3 마르코브 보상 프로세스
마르코브 보상 프로세스
시청
Week 5. 마르코브 결정 프로세스-1
5.1 MDP 개요
MDP 개요
시청
5.2 MDP 예시 - Examples of Markov Decision Process
MDP 예시 - Examples of Markov Decision Process
시청
Week 6. 마르코브 결정 프로세스-2
6.1 MDP 가치함수
MDP 가치함수
시청
6.2 Infinite-horizon MDP
Infinite-horizon MDP
시청
Week 7. 마르코브 결정 프로세스-3
7.1 Value Iteration
Value Iteration
시청
7.2 Policy Iteration
Policy Iteration
시청
Week 9. 강화학습 알고리듬-1
9.1 강화학습 Model-free Reinforcement Learning
강화학습 Model-Free Reinforcement Learning
시청
9.2 몬테칼로 학습 Monte-Carlo Learning
몬테칼로 학습 Monte-Carlo Learning
시청