Q : 차원 축소 방법 중에서 LDA(Linear Discriminant Analysis) 기법에 대해서 설명해주세요

A : 입력 데이터의 변수가 많으면 노이즈 및 다중공선성이 생겨 모형에 대한 정확도 및 해석력이 저하됩니다. 그래서 변수의 개수를 축소할 필요성이 생기는데 이때 사용되는 방식중 하나가 LDA입니다. 패턴 분류 및 기계학습 응용 프로그램의 전처리 단계에서 차원 축소 기법으로 일반적으로 사용됩니다. 목표는 차원의 저주를 사전에 방지하고 많은 변수의 데이터들로 인해서 엄청난 계산량을 줄여 비용을 감소시키는 목적도 있습니다.
LDA의 차원 축소 방법은 서로 다른 클래스 간의 분산과 클래스 내부의 분산의 비율을 최대화 하는 방식으로 데이터에 대한 차원을 축소하는 기법입니다. 이를 위해서 특징 공간상에서 클래스 분리를 최대화하는 주축으로 데이터를 저차원으로 투영하여 차원을 축소합니다.

<그림 1 LDA 데이터 투영>
위 그림의 예를 설명드리면 왼쪽에서 투영, 이해하기 쉽게 바라봤다고 했을 경우 두 클래스간의 분리가 잘 되지 않습니다. 아래에서 위로 바라보면 두 클래스간의 분리가 확실히 되기 때문에 좋은 투영입니다.