"이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."


[ML] 군집화 (Clustering)
728x90

 

머신러닝의 비지도 학습 중 군집화에 대해서 알아보겠습니다.

 

군집화 (Clustering)

군집화(Clustering)은 사전 정의 범주가 없는 상태에서 어떤 대상들의 특징을 구분해서 그룹으로 묶는 과정 입니다. 

군집들 사이의 관계를 분석하고, 데이터 전체의 구조에 대한 이해를 돕고자 하는 탐색적 분석 방법 입니다.

 

군집화는 다음과 같은 특징이 있습니다.

  • 유사한 데이터 그룹을 찾아냄
  • 전체 특징이 아닌 일부 특징만을 이용하여 군집화를 수행할 수 있음
  • 범주형 데이터를 군집화 하는 방법도 있음

 

반응형

 

군집화의 종류 (Clustering Algorithm)

군집 방법에 따라서 다양한 군집화 알고리즘이 있습니다. 

대표적인 군집 방법으로 계층적 군집( Hierarchical Clustering) 과 분할적 군집(Partional Clustering)이 있습니다.

 

계층적 군집화 (Hierarchical Clustering)

데이터 포인트들을 계층적인 구조로 군집화하는 방법으로 상향식(agglomerative)과 하향식(divisive) 접근법이 있습니다.

계층적 군집화는 군집 수를 미리 정할 필요가 없으며, 덴드로그램을 통해 군집 형성을 시각화할 수 있습니다.

대표적인 계층적 군집화 방법에는 응집형 (Agglomerative) 방법과 분리형 (Divisive) 방법이 있습니다.

 

분할적 군집 (Partional Clustering)

데이터셋을 미리 정해진 수의 군집으로 분할하는 방법입니다.

분할적 군집은 군집 방법이 간단하고 빠르며, 대규모 데이터셋에 적합하지만 초기 중심점 선택에 민감한 특징이 있습니다.

군집을 분할하는 방법에 따라 다음과 같은 분할적 군집화 방법이 있습니다.

  • 프로토타입 기반 군집 (Prototype-based Clustering)
  • 퍼지 군집 (Fuzzy Clustering)
  • 분포 기반 군집 (Distribution-based Clustering)
  • 밀도 기반 군집 (Density-based Clustering)
  • 커널 기반 군집 (Kernel-based Clustering)
  • 격자 기반 군집 (Grid-based Clustering)
  • 그래프 기반 군집 (Graph-based Clustering)

 

 

지금까지 비지도 학습 중 군집화 (클러스터링)에 대해서 간략하게 알아보았습니다. 

다음 포스팅 부터는 각 군집화 알고리즘의 자세한 사항에 대해서 포스팅 할 예정입니다.

 

 

 

머신러닝(Machine Learning)

1. 머신러닝이란? (Machine Learning?)

2. 머신러닝 학습 방법 - 지도학습 (Supervised Learning)

3. 머신러닝 학습 방법 - 비지도학습 (Unsupervised Learning)

    3.1. 군집화 (Clustering)

 

 

728x90
728x90
LIST