Distance of Clusters
클러스터끼리 서로 얼마나 관련되어 있는지 측정하기 위해서, 클러스터끼리의 거리를 계산할 수 있다. 거리를 계산하는 방법은 여러가지가 있는데, 다음과 같은 방법이 대표적이다. 1. Eucleadian Distance 2. Manhattan Distance 3. Correlation Measures 첫 번째로, Eucleadian Distance는 클러스터의 각 유전자에게 주어진 벡터값의 차이를 계산한다. 예를 들어, G1 = [1, 3, 5, 1], G2 = [5, 7, 2, 3]로 주어졌다면 G1과 G2의 거리는 같은 성분의 차의 제곱을 더한 값의 제곱근이 된다. 두 번째 Manhattan Distance는 더 단순하게, 주어진 데이터의 벡터 성분의 차의 절대값이다. 마지막으로 Correlation Me..
더보기
Cosequential Processing
Cosequential Processing이란, 2개 이상의 리스트를 입력으로 받아서, 각각의 리스트에 대해 선형적인 작업을 한 뒤 단일한 하나의 출력을 내는 것을 말한다. 왜 이런 작업이 필요한 것일까? 예를 들어, 현재 사용 가능한 메모리보다 다루어야 하는 데이터가 훨씬 크다면, 어쩔 수 없이 분할된 형태로 읽어들일 수 밖에 없을 것이다. 그러나, 만약 전체 데이터에 대해 정렬 작업을 해야 한다면 이것은 복잡한 문제가 된다. 어떤 정렬 알고리즘은 데이터 전체가 메모리에 올려져 있어야 하며, 전체 데이터의 일부분만 메모리에 올려져 있는 이와 같은 경우, 그러한 알고리즘은 사용할 수 없다. 즉, 전체가 아닌, 각각의 분할에 대해 작업을 한 뒤 그것을 합쳐서 하나의 완전한 형태의 출력물을 내야 하는데, 그..
더보기