Deep Learning

PCA

응엉잉 2022. 8. 16. 01:11

고차원의 데이터를 저차원의 데이터로 환원시키는 기법

다차원의 데이터분포를 가장 잘 설명하는 성분을 찾고 시각적으로 잘 알아볼 수 있게 만들어줌

https://bioinformaticsandme.tistory.com/42?category=807361 

 

[PCA] 주성분분석 1

[PCA] 주성분분석 1 Start. BioinformaticsAndMe ​ 주성분 분석(Principal component analysis; PCA) 이란? -정의: 고차원의 데이터를 저차원의 데이터로 환원시키는 기법 -필요: 다차원의 데이터 분포를 가장..

bioinformaticsandme.tistory.com

 

 

https://darkpgmr.tistory.com/110

 

[선형대수학 #6] 주성분분석(PCA)의 이해와 활용

주성분 분석, 영어로는 PCA(Principal Component Analysis). 주성분 분석(PCA)은 사람들에게 비교적 널리 알려져 있는 방법으로서, 다른 블로그, 카페 등에 이와 관련된 소개글 또한 굉장히 많다. 그래도 기

darkpgmr.tistory.com

 

분포된 데이터들의 주성분(principal component)을 찾아주는 방법

ex. 2차원 좌표평면에 n개의 점 데이터 (x1,y1), ..., (xn, yn) 이 타원형으로 분포

그림1

이 데이터들의 분포 특성을 가장 잘 설명하는 벡터 2개는 e1, e2

e1과 e2의 방향과 크기를 알면 데이터 분포의 형태를 단순하고 효과적으로 파악 가능

 

정리하자면 PCA는 여러 데이터들이 모여 이루는 분포의 주성분을 분석하는 방법

 * 주성분 : 데이터들의 분산이 가장 큰 방향 벡터

<그림1>에서는 e1 방향을 따라 데이터들이 가장 넓게 퍼져있음 = 분산이 가장 큼

e1에 수직이면서 데이터의 분산이 가장 큰 방향 : e2

 

n차원 데이터 집합에 PCA -> n개의 서로 수직인 주성분 벡터

3D 에서의 PCA

얼굴 인식에서 많이 사용됨