Jesper E. van Engelen, A survey on semi-supervised learning
Semi-supervised learning(준지도학습)
- 학습을 위해 라벨링된 데이터 뿐만 아니라 라벨링되지 않은 데이터를 사용하는 머신러닝의 한 분야다.
- supervised learning과 unsupervised learning의 중간 개념이다.
- 대부분의 경우에 많은 양의 라벨링되지 않은 데이터를 작은 라벨링된 데이터와의 조합으로 활용할 수 있게 해준다.
Semi-supervised classification
- Semi-supervised learning에서 가장 메이저한 연구 분야
- 본 논문에서는 이 부분에 집중하여 소개한다.
Purpose
- Semi-supervised learning에 처음인 연구자와 개발자뿐만 아니라 이미 익숙한 독자에게 지난 20년 간 개발된 주요 접근법과 알고리즘에 대해 더 깊은 이해를 돕는다.
- Semi-supervised classification의 새로운 taxonomy를 제안하여 라벨링되지 않은 데이터를 다루는 다양한 개념적, 방법론적 접근법에 통찰을 제시한다.
- 많은 semi-supervised learning이 가진 기본적인 가정이 서로 어떻게 연결되는지, 그리고 그것이 semi-supervised clustering 가정과 어떻게 연결되는지 보여준다.