1. SOM(Self Organizing Map)의 개요
가. SOM의 정의
인공신경망의 한 종류로, 입력 패턴의 속성을 보존하면서 고차원 데이터를 **2차원 평면(Map)**에 유사한 것끼리 가깝게 배치하여 시각화하고 군집화하는 비지도 학습(Unsupervised Learning) 기법입니다.
핀란드의 테우보 코호넨(Teuvo Kohonen) 교수가 제안하여 '코호넨 맵'이라고도 불립니다.
나. SOM의 주요 특징
차원 축소 및 시각화: 복잡한 고차원 데이터를 2차원 지도로 표현하여 직관적 이해 가능.
비지도 학습: 목표값(Label) 없이 입력 데이터의 통계적 특성만으로 자율적인 학습 수행.
위상 보존(Topology Preserving): 입력 공간에서 가까운 데이터는 출력 맵에서도 가깝게 배치됨.
경쟁 학습(Competitive Learning): 입력 벡터와 가장 유사한 가중치를 가진 뉴런 하나만 승리자로 선택(Winner-Take-All).
2. SOM의 구성요소 및 동작 원리
SOM은 입력층과 출력층(경쟁층)으로 구성된 단순한 2층 구조를 가집니다.
| 구성요소 | 세부 내용 | 역할 |
| 입력층 (Input Layer) | $n$차원의 입력 벡터 ($X$) | 학습 데이터를 신경망에 전달 |
| 출력층 (Competitive Layer) | 2차원의 격자(Lattice) 구조 뉴런 | 데이터가 투영되는 결과 지도 (Map) |
| 연결 강도 (Weights) | 입력 뉴런과 출력 뉴런 간의 가중치 | 각 뉴런이 대표하는 위치 벡터 ($W$) |
| 승리 뉴런 (BMU) | Best Matching Unit | 입력 벡터와 유클리드 거리가 가장 가까운 뉴런 |
| 이웃 함수 (Neighborhood) | BMU 주변 뉴런들의 범위를 결정 | 승리 뉴런 주변의 가중치도 함께 업데이트하여 위상 보존 |
3. SOM과 일반 신경망(Back-propagation 등) 분석기법의 차이점
SOM은 일반적인 인공신경망(ANN)과 학습 방식 및 목적에서 뚜렷한 차이를 보입니다.
| 비교 항목 | SOM (Self Organizing Map) | 일반 신경망 (예: MLP, CNN 등) |
| 학습 방식 | 비지도 학습 (Unsupervised) | 지도 학습 (Supervised) |
| 주요 목적 | 군집화(Clustering), 시각화, 차원 축소 | 분류(Classification), 회귀(Regression) |
| 연결 구조 | 전결합층(2층 구조) | 다층 구조 (Hidden Layers 존재) |
| 알고리즘 | 경쟁 학습 (Winner-Take-All) | 오차 역전파 (Back-propagation) |
| 오차 수정 | 승리 뉴런과 이웃의 가중치만 조정 | 모든 층의 가중치를 에러 기반으로 수정 |
| 데이터 활용 | 정답(Label)이 없는 탐색적 데이터 분석 | 정답이 있는 예측 모델링 |
4. SOM의 학습 프로세스 (Step-by-Step)
가중치 초기화: 모든 출력 뉴런의 가중치($W$)를 작은 무작위 값으로 초기화.
승리 뉴런(BMU) 탐색: 입력 벡터($X$)와 가중치 벡터($W$) 간의 거리가 가장 짧은 뉴런 선택.
$$dist = \sqrt{\sum (X_i - W_i)^2}$$가중치 업데이트: BMU와 그 이웃 뉴런들의 가중치를 입력 벡터 방향으로 이동.
$$W_{new} = W_{old} + \alpha(t) \times L(t) \times (X - W_{old})$$(단, $\alpha$: 학습률, $L$: 이웃 함수)
반복: 학습률과 이웃 범위를 점차 줄여가며 전체 데이터를 반복 학습하여 수렴.
5. 기술사적 제언: SOM의 활용 및 한계 극복
활용 사례: 대규모 고객 세분화(Segmentation), 유전자 패턴 분석, 텍스트 마이닝의 키워드 맵 구축 등 데이터의 특징을 시각적으로 파악해야 하는 영역에서 강점을 가집니다.
한계 및 대응:
초기값 민감도: 초기 가중치 설정에 따라 결과가 달라질 수 있으므로 반복 수행이 필요합니다.
격자 크기 결정: 맵의 크기($X \times Y$)를 사전에 정해야 하므로, 데이터의 밀도를 고려한 최적의 노드 수 산정 기법이 요구됩니다.
심화 기술 연계: 고차원의 비정형 데이터 분석 시, **차원 축소(PCA)**를 선행하거나 Deep Learning 기반의 특징 추출 이후 SOM을 적용하는 하이브리드 아키텍처가 실무적으로 효과적입니다.
댓글 없음:
댓글 쓰기