최소제곱법의 결정적인 문제점(약점) 두가지 1) 예측 정확도 : 편향은 낮지만 분산은 높게 추정하는 경우가 있음(불안정한 모델이 만들어지는 경우가 있음) 편향이 낮다 = 적합도가 높다 분산이 높다 = 모집단에서 어떤 데이터를 샘플링해서 회귀분석을 하느냐에 따라서 추정되는 모수값이 크게 달라진다 2) 설명력 가장 좋은 효과를 보이는 매우 작은 서브셋은 설명력을 저하시킨다 서브셋 여러개의 독립변수를 포함하는 경우/포함하지 않는 경우 두가지 경우를 모두 고려한 data set k개의 독립변수가 있다면 (2^k-1) 개의 subset 존재 (모든 독립변수 사용하지 않는 경우를 제외) 최적 서브셋 회귀 (오차)^2 의 합을 최소화하는 서브셋을 구하는 과정 회귀분석에서의 변수 선택 Extra Sum of Squar..