모형선정척도 = 적합결핍 + 복잡도
적합결핍과 복잡도는 상충관계이기 때문에 적당히 조율해야함
* SSE : 회귀분석을 통해 설명할 수 없는 변동량 (SSE가 클수록 적합결핍이라는 뜻)
* p : 독립변수의 수 = 추정해야하는 모수 (p 가 클수록 모델 복잡도가 커진다는 뜻)
* n : 사용한 data 의 수
* MSE : 오차 / MSE all 은 고정
모형선정척도
과소적합 모델 : SSE 크고 p 작음 -> AIC가 큼 -> 안좋은 모형
과적합 모델 : SSE 작고 P 큼 -> AIC가 큼 -> 안좋은 모형