Computer Science/AI :: 인공지능

인공지능 강의 9화 :: 특징, 주성분 분석, 베이즈 분류기, 매개변수, 비 매개변수

HJPlumtree 2021. 10. 17. 20:20

인공지능 강의 9화를 보며 배운내용

 

 

KEYWORDS

  • 거리측정자: 특징공간상에 두 좌표 사이 거리를 계산하는 척도

  • 주성분 분석(Principal Component Analysis, PCA): 고차원의 데이터 공간을 주성분축들로 구성된 공간으로 선형 직교변환을 해서 상관관계를 최소화하는 공간으로 변환.
    그 중 큰 분산을 갖는 축으로 구성된 저차원의 데이터 공간으로 표현함으로써 특징 차원을 축소

  • 생성 모델(Generative Model): 어떤 클래스 C에 대해 특징벡터 x가 발생할 조건확률 p(x|C) 를 학습하는 모델

  • 판별 모델(Discriminative Model): 어떤 특징벡터 x가 주어졌을 때 클래스 C에 속할 조건확률 p(C|x) 를 추정하는 모델

  • 베이즈 분류기: 특징벡터가 관찰되었을 때, 특정 클래스에 속할 조건확률을 베이즈 이론에 따라 계산하여 식별하는 분류기

  • 최대가능도 추정(Maximum Likelihood Estimation): 학습 표본 데이터집합이 관찰될 가능성이 최대인 매개변수를 찾아 모집단의 매개변수를 추정하는 방법

  • k-근접아웃: 어떤 벡터가 특정 클래스에 속할 확률을 그 표본과 가장 가까운 k개의 표본 벡터 중 해당 클래스의 표본 수의 비율로 정하여 그 값이 가장 큰 클래스에 속하는 것으로 판단하는 방법

 

 

특징 추출

특징(feature): 식별에 사용될 수 있는 정보

목적: 판별 작업에 의미 있는 값을 얻는다.

 

기호,열, 벡터 형식 등으로 표현

패턴공간의 차수를 낮춘다(계산을 줄인다)

 

 

주성분 분석

선형 변환을 통해 특징요소간 상관관계를 최소화하는 하는 공간으로 변환 

인식을 잘할수 있는 공간으로 변할 수 있다.

 

 

거리측정자의 종류

  • 직선 거리 구할 때: 유클리드 거리(Euclidean Distance)
  • Yes/No 등 bool 값을 다루는 경우: 헤밍거리(Hamming Distance)
  • 각 축 사이의 거리의 합: 도시블록 거리맨해튼 거리)
  • 각 축 성격이 다를 때 적용하는 거리: 마할라노비스 거리(Mahalanobis Distance)

 

 

베이즈 분류기

미지의 특징벡터 x가 두 클래스 C1과 C2중 어느 것에 속하는지 식별

각각의 클래스에 속할 조건확률이 가장 큰 클래스로 분류

 

p(C1 | x) > p(C2 | x)

=> x는 C1

 

p(C1 | x) < p(C2 | x)

=> x는 C2

 

=> 확률 분포를 구할 수 있어야 된다

매개변수, 비 매개변수 방식이 있다.

 

 

매개변수 방식

모집단의 확률 모델의 매개변수를 표본집합으로 추정하는 방식

최대가능도 추정

확률 모델의 배개변수 추정하는 방식.

학습 표본 데이터 집합이 관찰될 가능성이 최대인 매개변수를 찾아,

모집단의 매개변수를 추정하는 방법이다.

 

 

비 매개변수 방식

거리 척도와 학습 표본 집합을 이용하며 각각 클래스에 속할 확률을 계산하는 방식

k-근접이웃(k-Nearest Neighbor)

미지의 패턴의 특징벡터와 가장 가까운 k개의 학습 표본을 찾아,

그 중 가장 많은 표본이 포함된 클래스로 인식

확률분포 등 안따지고 표본만 가지고 계산

 

 

AI by Maximalfocus #unsplash