본문 바로가기

Library/Bioinformatics

Phylogenetic Analysis 1

 계통 분석(Phylogenetic Analysis)이란, 진화 관계나 트리(tree)를 형성해서, 이들의 진화적인 관계를 추적해보는 것이다. 진화 관계를 분석하는 대상이 되는 것들을 탁사(taxa)라 하는데, 경우에 따라 유전자나 종과 같은 것이 될 수 있다. 보통, 진화 관계를 추적하는데 먼저 DNA나 단백질(protein)의 서열 분석을 거친 뒤에 계통 분석 작업을 한다.

Phylogenetic Tree는 대개 계통도(系統圖) 정도로 번역되는데, 형상은 크게 중요하지 않으며 서로의 관계가 중요하다. 이 계통도는 3가지 종류가 있는데, Cladogram, Phylogram, Ultrametric Tree로 나뉘어진다.

먼저, Cladoram은 트리의 구성에서 간선(branch)의 길이가 길든 짧든 상관하지 않는다. 이 방법은 다만 어떻게 분류되는지를 대략적으로 알려준다. 그리고, Phylogram에서의 간선의 길이는, 서로의 유전적인 관계를 나타낸다. 같은 종류에 묶여있는 탁사라고 하더라도, 간선의 길이에 따라 다른 분류에 속한 탁사보다 유전적으로 훨씬 가까운 관계가 될 수 있다. 마지막으로 Ultrametric Tree은 진화적인 관계보다 시간적인 요소에 훨씬 가중치를 둔 것이다. 각 간선의 길이는 탁사들 사이의 시간적 흐름을 보여준다.

이 계통도를 작성하는 과정에서, 존재하지 않는 가상의 노드가 존재할 수 있는데, 이것은 서로 관련된 탁사들의 가상의 조상을 나타내며, 내부 노드(internal node)라 불린다.

그렇다면, 이 계통도로 무엇을 할 수 있는가? 계통도는 유전적인 변화가 언제 일어난 것인지, 그리고 유전적 변화가 단일하게 일어난 것인지, 유전적 변화가 지역적으로 일어난 것인지 따위에 대한 정보를 알려준다. 계통도를 작성하는 궁극적인 목표는, 관심이 있는 탁사들의 진화적인 관점에서 선형적인 형태의, 분화된 관계를 알아보는 것이다.