수업내용/목표
및 응용능력을 배양한다.
주차 |
주차명 |
차시 |
차시명 |
학습요소 |
---|---|---|---|---|
1 |
강좌개요 및 단순회귀모형 |
1-1 |
회귀분석, 단순회귀모형, 모형의 추정 |
강의영상, 퀴즈 |
학습목표 |
회귀분석의 개념에 대해 이해하고, 최소자승법에 의한 회귀계수 추정 및 오차항 분산 추정에 대해 학습한다. |
|||
1-2 |
회귀계수 추정량의 분포, 모형의 검정 |
강의영상, 퀴즈 |
||
학습목표 |
회귀계수 추정량의 분포를 이용하여 회귀계수에 대한 t-검정 및 회귀모형의 유의성을 위한 F-검정을 수행한다. |
|||
1-3 |
회귀모형의 진단, 반응치의 예측 |
강의영상, 퀴즈 |
||
학습목표 |
잔차를 통하여 회귀 모형의 가정이 성립하는지 진단하고, 평균반응치 및 미래 반응치의 예측을 다룬다. |
|||
학습 목표 |
1) 예측 및 분류 문제 정의 및 관련 기법들을 이해하고, 설명할 수 있다. 2) 단순회귀모형 이론에 대해 설명할 수 있다. 3) 가설 검정의 기초개념을 이해하고, 설명할 수 있다. 4) 실제 데이터에 적용하여 주어진 독립변수가 종속변수를 어떻게 설명하는 지 직접 해석할 수 있다. |
|||
2 |
다중회귀 모형 이론 |
2-1 |
다중회귀모형 및 모형의 추정 |
강의영상, 퀴즈 |
학습목표 |
다중회귀모형의 개념에 대해 이해하고, 회귀계수 및 오차항 분산의 추정과정을 설명할 수 있다. |
|||
2-2 |
회귀계수 추정량의 분포 및 모형의 검정 |
강의영상, 퀴즈 |
||
학습목표 |
회귀계수의 추정 및 t-검정, 그리고 회귀모형의 유의성을 검정할 수 있는 F-검정을 학습한다. |
|||
2-3 |
단계적 회귀분석 및 다중공선성 |
강의영상, 퀴즈 |
||
학습목표 |
추가 설명력의 개념을 이해하고, 단계적 회귀분석 결과를 해석할 수 있다. 데이터에서 다중공선성 문제를 진단하고 알맞은 방법으로 해결할 수 있다. |
|||
2-4 |
반응치의 예측 및 변수 변환 |
강의영상, 퀴즈 |
||
학습목표 |
데이터가 주어졌을 때 평균 및 미래 반응치와 그 신뢰 구간을 계산할 수 있다. 범주형 변수에 대하여 지시변수를 활용한 변수 변환을 다루며, 비선형 형태의 모형을 선형형태의 변환하는 방법등을 배운다. |
|||
학습 목표 |
1) 다중회귀모형의 추정 및 검정을 이해하고, 주어진 문제를 해결할 수 있다. 2) 단계적 회귀분석과 다중공선성을 이해하고, 적합한 변수들만을 이용해 회귀모형을 구축할 수 있다. 3) 필요한 경우 적절한 변수 변환을 통해 범주형 독립변수 및 비선형 함수 문제를 선형회귀모형으로 해결할 수 있다. |
|||
3 |
시계열 분석 기법 |
3-1 |
평활화 모형 및 예측 성능 척도 |
강의영상, 퀴즈 |
학습목표 |
평활화 모형들의 내용과 그 차이를 이해하고, 예측성능의 척도를 활용하여 분석 결과를 평가한다. |
|||
3-2 |
안정적 ARMA 모형, ARMA 모형의 식별과 추정 |
강의영상, 퀴즈 |
||
학습목표 |
AR, MA, ARMA 모형의 내용을 이해하고, 새로운 시계열 데이터가 주어졌을 때 어떤 모형을 따르는 지 파악할 수 있다. |
|||
3-3 |
비안정적 시계열 및 시계열 예측 |
강의영상, 퀴즈 |
||
학습목표 |
비시계열 데이터에 존재하는 추세, 계절성 등을 파악하여 제거할 수 있고, 이를 이용해 미래의 시계열 값을 예측할 수 있다. |
|||
학습 목표 |
1) 다양한 비안정적 시계열 문제들이 증가함에 따라, 본 강좌를 통해 이 문제를 해결할 수 있는 능력을 기른다. 2) 예측기법으로의 시계열분석 기법을 이해하고, 주어진 문제를 해결할 수 있다. 3) 다양한 목적에 따라 시계열 분석 기법을 응용 하여 데이터 분석에 활용할 수 있다. 4) 실제 분석하고자 하는 시계열 데이터를 직접 다루어 원하는 미래 값을 예측할 수 있다. |
|||
4 |
로지스틱 회귀모형 이론 |
4-1 |
분류 문제, k-인접객체범, 분류성능 |
강의영상, 퀴즈 |
학습목표 |
분류 문제의 개념과 k-인접객체법을 이해하고 설명할 수 있다. 분류성능 척도를 학습한다. |
|||
4-2 |
이분 로지스틱 회귀분석 |
강의영상, 퀴즈 |
||
학습목표 |
로지스틱 회귀 모형의 기본 개념을 이해하고 이분형 종속 변수를 예측하는 모형을 학습할 수 있다. |
|||
4-3 |
명목 및 서열 로지스틱 회귀모형 |
강의영상, 퀴즈 |
||
학습목표 |
종속변수의 형태에 따른 명목형 및 서열형 로지스틱 회귀 모형을 이해한다. |
|||
학습 목표 |
1) k-인접객체법을 학습하고 활용할 수 있다. 2) 분류기법으로서의 로지스틱 회귀모형 이론을 이해하고, 활용할 수 있다. 3) 분류기법의 평가척도를 이해하고, 문제해결을 위해 활용할 수 있다. 4) 종속변수의 형태에 따른 모형 구축 방법을 학습한다. |
|||
5 |
판별분석 이론 및 알고리즘 |
5-1 |
피셔 분류방법 |
강의영상, 퀴즈 |
학습목표 |
피셔 방법을 이용해 분류 경계식을 도출하고 이를 이용해 관측치를 분류할 수 있다. |
|||
5-2 |
선형판별분석에 의한 분류규칙 |
강의영상, 퀴즈 |
||
학습목표 |
데이터의 확률 분포와 사전 확률을 고려하여 범주별 판별함수를 구하고 이를 이용해 새로운 관측치를 분류 (범주를 예측)할 수 있다. |
|||
5-3 |
오분류비용 고려 및 이차판별분석 |
강의영상, 퀴즈 |
||
학습목표 |
오분류비용을 고려한 선형판별분석과 이차판별분석을 이해하고, 정오분류표를 통해 각 방법의 성능을 판단할 수 있다. |
|||
학습 목표 |
1) 판별분석을 위한 기초이론을 이해하고, 각각의 분석기법을 적용 사례를 토대로 설명할 수 있다. 2) 의사결정론 입각하여 판별분석을 시행할 수 있다. 3) 주어진 문제 상황에 따라 사전확률 또는 오분류비용을 적절히 고려하여 판별분석을 시행할 수 있다. 4) 상황에 가장 적합한 성능 척도를 고려하여 판별분석 결과를 평가할 수 있다. |
|||
6 |
트리기반 분류기법 이론 |
6-1 |
트리 기법 개요 |
강의영상, 퀴즈 |
학습목표 |
트리 모형의 전반적인 학습 과정을 익히고, 각 과정에 적용하는 기법들의 내용을 이해한다. |
|||
6-2 |
트리의 형성 |
강의영상, 퀴즈 |
||
학습목표 |
분지 기준을 이해하고, 분지 기준이 되는 척도를 활용하여 트리를 형성할 수 있다. |
|||
6-3 |
가지치기 및 최적트리 |
강의영상, 퀴즈 |
||
학습목표 |
CART에서의 비용-복잡도 척도를 통해 가지치기를 하고, 가지치기된 후보 트리들 중에서 최적트리를 결정할 수 있다. |
|||
학습 목표 |
1) 실제 새로운 데이터에 대해 분류를 해야 하는 많은 문제들이 존재함을 깨닫고, 본 강의에서 그 해결책을 찾는다. 2) 트리기반 이론을 이해하고, 문제해결에 활용할 수 있다. 3) CART기법의 핵심 이론을 이해하고, 데이터를 분석할 수 있다. 4) 불순도 함수를 활용하여 데이터 분석을 시행할 수 있다. 5) CART기법을 실제로 프로그래밍 툴을 통해 사용할 수 있다. 6) 새로운 데이터에 대해 분류를 해야하는 문제에 대해 직접 예측트리모형을 만들 수 있고, 중요한 독립변수를 선택할 수 있다. |
|||
7 |
서포트벡터머신 이론 및 알고리즘 |
7-1 |
선형 SVM - 분리가능 경우 |
강의영상, 퀴즈 |
학습목표 |
분리 가능한 경우를 통해 선형 SVM의 기본 개념과 KKT 조건을 이해하고, 설명할 수 있다. |
|||
7-2 |
선형 SVM - 분리 불가능 경우 |
강의영상, 퀴즈 |
||
학습목표 |
분리 불가능한 경우에 대해 앞의 분리 가능한 경우의 선형 SVM 모형을 확장할 수 있다. |
|||
7-3 |
비선형 SVM |
강의영상, 퀴즈 |
||
학습목표 |
비선형 모형의 기본 개념과 커널 트릭을 이해하고, 설명할 수 있다. |
|||
학습 목표 |
1) 최적화기반의 분류기법인 서포트벡터머신의 이론을 이해하고, 설명할 수 있다. 2) KKT 조건을 이용하여 최적화할 수 있다. 3) 문제에 따른 모형 구축 방법을 이해한다. 4) 커널 트릭을 통해서 비선형 모형을 학습할 수 있다. |
|||
8 |
기말고사 |
과제명 | 퀴즈 | 기말고사 |
---|---|---|
반영비율 | 40% | 60% |
※ 총 60% 이상 점수 획득 시, 이수증을 발급받을 수 있습니다.
강좌수준: 중 (또는 대학교 3학년 수준)
선수요건: 기본적인 확률 및 통계, 선형 대수, 최적화에 대한 지식 필요
교재
- 전치혁, 데이터마이닝 기법과 응용
참고문헌
- 전치혁, 정민근, 이혜선, 공학응용통계
- Massimiliano Marcellino, James H. Stock, Mark W. Watson (2006) "A
comparison of direct and iterated multistep AR methods for
forecasting
macroeconomic time series", Journal of Econometrics, (135):1–2,
499-526.
- Tan, Pang-Ning, M. Steinbach and V. Kumar (2006) "Introduction to
data mining", Pearson International Edition, Boston.
- Fisher, Ronald Aylmer (1936) "The use of multiple measurements in
taxonomic problems" Annals of Eugenics, 7, 179-188.
- Burges, Christopher J. C. (1998) "A tutorial on support vector
machines for pattern recognition", Data Mining and Knowledge
Discovery,
2, 121-167.
기본적인 통계, 선형 대수, 그리고 최적화에 대한 지식이 필요합니다.
데이터 분석 시 사용할 수 있는 프로그래밍 언어는 Python, Matlab, R, C++ 등 매우 다양하며, 특정 언어에서 제공하는 library 등을 분석에 활용할 수 있습니다.
질문과 답변: 24시간 이내 답변 가능합니다. (게시판을 이용해 주세요! )