k-means 썸네일형 리스트형 Clustering Method 어떤 클러스터링 방법을 사용하던지, 모든 데이터를 대상으로 클러스터링을 하는 것은 아니다. 특히, 전체 데이터는 노이즈가 심할 수 있기 때문에, 차이에 관계없이 고정적인 결과를 보이는 데이터는 제외하는 것이 좋다. k-means 클러스터링 방법은 클러스터의 거리를 계산할 때 Eucleadian Distance를 가장 자주 쓴다. 이 방법은 먼저 임의의 k개의 위치를 선택하고, 이 위치에 대해 데이터의 거리를 계산하여 초기 k개의 클러스터 그룹을 형성한다. 다음, 이 클러스터의 평균점을 계산하고, 이 평균점에 대해 다시 모든 데이터의 거리를 계산하여 더 좋은 클러스터를 형성한다. 이 과정을, 클러스터 사이의 데이터 이동이 최소가 될 때까지 반복한다. 이 방법은 주변의 몇몇 노이즈에 의해 클러스터링 결과가 .. 더보기 이전 1 다음