본문 바로가기

Library/Bioinformatics

DNA Structure

DNA는 보통 염기쌍이나 뉴클리오타이드(nucleotide)라고 부르는 네 개의 분자로 구성된 중합체이다. 네 개 분자의 명칭과 약자는 아데닌(A, Adenine), 시토신(C, Cytosine), 구아닌(G, Guanine), 티민(T, Thymine)이다.

이러한 염기쌍들은 DNA의 한 가닥을 형성하기 위하여 서로 끝과 끝이 연결되어 있다.

세포에서 DNA는 보통 두 가닥의 형태로 나타나며 두 가닥은 알려져 있듯이 이중 나선 형태로 서로를 감싸고 있다. 이중 나선형의 두 가닥은 염기들이 서로 쌍을 이루고 있으며 염기쌍이라고 알려져 있다. 한 가닥 위에서 하나의 A는 항상 다른 가닥 위의 T와 마주하며 G는 언제나 C와 쌍을 이루고 있다.

또한 가닥에는 방향이 존재한다. 뉴클리오타이드의 한 쪽 끝을 5'(5 prime)이라고 하고 다른 한 쪽 끝을 3'(3 prime)이라고 한다. 뉴클리오타이드들이 DNA의 단일 가닥을 만들기 위해 결합할 때 그들은 항상 한 쪽 끝의 5'을 다른 한쪽 끝의 3'과 연결한다. 더 나아가 DNA가 RNA로 전사될 때와 같이 세포가 DNA를 이용할 떄 5'에서 3' 방향으로 차례 차례 염기가 결합한다. 따라서 DNA가 작성될 때는 왼쪽에서 오른쪽으로 연결되어 5'에서 3' 방향으로 되는 것이다. 부호화된 유전자는 어느 쪽 가닥 위에도 나타날 수 있으므로 DNA를 탐색하고 분석할 때는 두 개의 가닥을 모두 살펴보는 것이 중요하다.

두 개의 가닥들이 이중 나선 안에서 연결될 때 두 개의 가닥은 서로 다른 방향을 취한다. 즉 한 쪽 가닥이 5'에서 3'로 흐르는 방향이면 다른 가닥에서는 반대 방향인 5'에서 3'으로 흐른다. 따라서 이중 나선의 각 끝에 이르면 하나의 가닥은 3'으로 끝나고 다른 가닥은 5'으로 끝난다.

염기쌍은 항상 A-T와 C-G로 쌍을 이루고 그러한 가닥의 방향이 서로 반대이기 때문에 역상보의 관계를 가진다. 역상보(reverse complement)라는 용어는 두 가닥 위에 존재하는 염기들의 관계를 나타낸다. 방향이 서로 반대이기 떄문에 '역(reverse)'이며 염기들이 항상 A와 T, C와 G와 같이 그들의 상보 관계에 있는 염기와 쌍을 이루기 때문에 '상보(complement)'이다.

이러한 사실과 DNA의 단일 가닥이 주어지면 이중 나선 안에 어떠한 쌍의 가닥들이 존재하는지 밝히는 일은 쉽다. 모든 염기들을 간단히 그들과 상보 관계에 있는 염기로 바꾼다. 즉 A는 T로, T는 A로, C는 G로, G는 C로, G는 C로 말이다. DNA가 5'에서 3' 방향으로 작성되기 때문에 그 다음에는 DNA는 상보한 뒤 그것을 역으로 작성하면 된다.


Reference
James D. Tisdall, Beginning Perl for Bioinformatics, O'Reilly, 박현석 역, '펄로 시작하는 바이오인포매틱스, 한빛미디어