고차원의 데이터를 저차원의 데이터로 환원시키는 기법
다차원의 데이터분포를 가장 잘 설명하는 성분을 찾고 시각적으로 잘 알아볼 수 있게 만들어줌
https://bioinformaticsandme.tistory.com/42?category=807361
[PCA] 주성분분석 1
[PCA] 주성분분석 1 Start. BioinformaticsAndMe 주성분 분석(Principal component analysis; PCA) 이란? -정의: 고차원의 데이터를 저차원의 데이터로 환원시키는 기법 -필요: 다차원의 데이터 분포를 가장..
bioinformaticsandme.tistory.com
https://darkpgmr.tistory.com/110
[선형대수학 #6] 주성분분석(PCA)의 이해와 활용
주성분 분석, 영어로는 PCA(Principal Component Analysis). 주성분 분석(PCA)은 사람들에게 비교적 널리 알려져 있는 방법으로서, 다른 블로그, 카페 등에 이와 관련된 소개글 또한 굉장히 많다. 그래도 기
darkpgmr.tistory.com
분포된 데이터들의 주성분(principal component)을 찾아주는 방법
ex. 2차원 좌표평면에 n개의 점 데이터 (x1,y1), ..., (xn, yn) 이 타원형으로 분포
이 데이터들의 분포 특성을 가장 잘 설명하는 벡터 2개는 e1, e2
e1과 e2의 방향과 크기를 알면 데이터 분포의 형태를 단순하고 효과적으로 파악 가능
정리하자면 PCA는 여러 데이터들이 모여 이루는 분포의 주성분을 분석하는 방법
* 주성분 : 데이터들의 분산이 가장 큰 방향 벡터
<그림1>에서는 e1 방향을 따라 데이터들이 가장 넓게 퍼져있음 = 분산이 가장 큼
e1에 수직이면서 데이터의 분산이 가장 큰 방향 : e2
n차원 데이터 집합에 PCA -> n개의 서로 수직인 주성분 벡터
얼굴 인식에서 많이 사용됨
'Deep Learning' 카테고리의 다른 글
AutoEncoder와 anomaly detection (0) | 2022.08.17 |
---|---|
PyTorch : Dataset과 DataLoader (0) | 2022.08.16 |
PyTorch : class와 nn.Module 이용해서 신경망 모델 정의 (0) | 2022.08.16 |
self-supervised pre-training (0) | 2022.07.16 |
self-supervised learning (0) | 2022.07.15 |