본문 바로가기

Mathematics

PCA (Principal Component Analysis, 주성분분석)

336x280(권장), 300x250(권장), 250x250, 200x200 크기의 광고 코드만 넣을 수 있습니다.

PCA 는 간단히 아래와 같은 그림으로 표현할 수 있다.

 

 

출처: http://www.nlpca.org/pca_principal_component_analysis.html

 

 

즉...

 

간단히 설명하자면, 모든 성분들의 주축을 찾아내어~

 

해당 축에 대해 투영시킴으로써, 데이터가 고르게 분포된 형태의 값을 얻어 낸다는 것이다.

 

많은 사람들이 주축을 찾아낸다는 부분에서 많이 당황스러워한다.

 

기조적인 선형대수 내용이라고 볼 수 있다.

 

참고로 얘기하자면, 선형대수의 Eigen vector 를 이해하지 못하면 PCA를 이해할 수 없다.

 

 

PCA의 순서는 간단히 다음과 같다.

 

 

1. 전체 데이터의 평균을 구한다.

 

2. 전체 데이터에 평균을 뺀다

 

3. 공분산 행렬을 만든다.

(공분산 행렬은 모든 요소의 공통된 부분을 뺀 개별적 특징이 포함된 데이터라고 표현할 수 있다.)

 

4. 공분산 행렬을 이용해 Eigen value 와 Eigen vector 를 구한다.

 

5. 전체 데이터를 Eigen vector 에 projection 한다. 

(좀 더 풀어서 얘기하자면... projection matrix(eigen vector 들의 모음) 을 모든 데이터에 곱한다는 말)

 

 

간단하게 표현하긴 하였으나, 많은 내용이 포함되어 있다.

 

...

 

내가 처음 PCA에 대한 개념을 배울때... 위와 같은 글을 보았다면 이해를 하였을까?

전혀... 못할것 같다. ㅎㅎㅎ

 

아래의 사이트와 자료를 참고하자!

 

참고로, 및에 pdf 자료에는 실제 데이터를 적용한 예제들이 포함되어 있다. (p.12)

 

appendix 에 implementation code 도 있다.

 

확인해보자~

 

 

principal_components.pdf

 

 

http://en.wikipedia.org/wiki/Principal_component_analysis

 

 

 

 

 

================================================================== 

영어가 힘들어서...

공부를 못하겠다고 한다면... 


번역 되어 있는 과학기술만 익히는 수밖에...

 

물론... PCA를 이용한 한글 자료 무지 많고, 논문도 넘처나지만...

한글 번역 되어 있으면 공부하고, 안되어 있으면 포기하는...

==================================================================

'Mathematics' 카테고리의 다른 글

베이즈 정리 (Bayes' Theorem)  (0) 2014.01.16
[Wavelet Transform] An Introduction to Wavelets - Amara Graps  (1) 2012.02.07
수학 기호  (0) 2012.02.01