본문 바로가기

Library/Bioinformatics

Genetic Code

Codon이란, 어떤 DNA나 RNA 서열이 어떤 단백질로 번역되지를 표현한 것이다. 3개의 뉴클리오타이드(nucleotide)가 하나의 단백질로 번역된다. A, T, G, C 각각의 뉴클리오타이드를 조합할 수 있는 방법은 총 64가지이지만, 실제로 22가지의 단백질로 번역되고, 중복이 존재한다.



예를 들어, AUG의 뉴클리오타이드는 다음 뉴클리오타이드를 단백질로 번역하라는 신호를 보내며, UAA, UAG, UGA 뉴클리오타이브 배열은 번역을 중단하라는 신호를 보낸다. ORF(Open Reading Frame)란, Start Codon에서부터 Stop Codon을 만날 때까지의 서열이다. 이 단위는 하나의 단백질을 만든다. 또, Codon에서는 Leucine : Alanine : Tryptophan의 비율이 6 : 4 : 1로 나타나지만, 실제 세포에서는 같은 비율로 나타나는 것은 아니다.