School/머신러닝

다중회귀모형의 선택

응엉잉 2022. 3. 29. 23:10

모형선정척도 = 적합결핍 + 복잡도

적합결핍과 복잡도는 상충관계이기 때문에 적당히 조율해야함

* SSE : 회귀분석을 통해 설명할 수 없는 변동량 (SSE가 클수록 적합결핍이라는 뜻)

* p : 독립변수의 수 = 추정해야하는 모수 (p 가 클수록 모델 복잡도가 커진다는 뜻)

* n : 사용한 data 의 수

* MSE : 오차 / MSE all 은 고정

 

모형선정척도

 

과소적합 모델 : SSE 크고 p 작음 -> AIC가 큼 -> 안좋은 모형

과적합 모델 : SSE 작고 P 큼 -> AIC가 큼 -> 안좋은 모형

'School > 머신러닝' 카테고리의 다른 글

선형분류  (0) 2022.04.06
과적합과 과소적합  (0) 2022.03.30
회귀분석에서의 변수선택  (0) 2022.03.30
서브셋  (0) 2022.03.30
다중공선성  (0) 2022.03.29