DNA와 비슷한 단백질은 소수의 간단한 분자들로 구성된 중합체이다. DNA가 네 개의 뉴클리오타이드로 구성되어 있는 것과 같이 단백질은 20개의 아미노산으로 이루어져 있다. 이러한 아미노산은 어떠한 순서로도 나타날 수 있으며 각 아미노산에 대한 명칭과 약자는 다음과 같다.
A Ala Alanine
B Asx Aspartic acid or Asparagine
C Cys Cysteine
D Asp Aspartic acid
E Glu Glutamic acid
F Phe Phenylalanine
G Gly Glycine
H His Histidine
I Ile Isoleucine
K Lys Lysine
L Leu Leucine
M Met Methionine
N Asn Asparagine
P Pro Proline
Q Gln Glutamine
R Arg Arginine
S Ser Serine
T Thr Threonine
V Val Valine
W Trp Tryptophan
X Xxx Unknown
Y Tyr Trrosine
Z Glx Glutamic acid or Glutamine
각각의 아미노산은 아미노(amino) 그룹과 카복실(carboxyl) 그룹으로 구성되어 있다. 아미노산들은 펩타이드 결합(peptide bond)이라는 화학적 사슬을 인접한 아미노산의 아미노산 그룹과 카복실 그룹 사이에 형성한다. 20개의 아미노산은 각각 기본 골격에서 돌출된 상이한 곁사슬을 가지고 있으며 이러한 곁사슬의 화학적 속성들은 단백질의 속성을 결정하는데 중요하다.
단백질은 보통 DNA보다 복잡한 3차원의 구조를 가지고 있다. 펩타이드 결합은 매우 자유롭게 순환할 수 있기 때문에 단백질은 다양한 3차원 구조를 형성할 수 있다. DNA의 이중 나선(double helix)과는 달리 단백질은 다양하고 상이한 형태로 접혀지는 경향이 있으며 함께 조합된 아미노산은 한 개 또는 그 이상의 가닥을 구성하고 있다.
가닥을 구성하고 있는 아미노산의 서열을 1차 구조(the primary structure)라고 하며 지엽적인 구조를 형성하고 있는 나선(helices)이나 베타 가닥(beta-strands) 또는 회전(turns)과 같은 구조를 2차 구조(the secondary structure)라고 한다.
다음 단계의 결합(folding)이나 조합을 3차와 4차 단백질 구조라 한다.
2차 구조 또는 더 상위 구조의 데이터보다는 일차적인 서열 데이터가 훨씬 많다. 사실 1차 단백질 서열 데이터는 수없이 많다(이는 DNA로부터 1차 단백질의 서영을 확인하는 것이 상대적으로 쉽기 때문이다).
Reference
James D. Tisdall, Beginning Perl for Bioinformatics, O'Reilly, 박현석 역, 펄로 시작하는 바이오인포매틱스, 한빛미디어
A Ala Alanine
B Asx Aspartic acid or Asparagine
C Cys Cysteine
D Asp Aspartic acid
E Glu Glutamic acid
F Phe Phenylalanine
G Gly Glycine
H His Histidine
I Ile Isoleucine
K Lys Lysine
L Leu Leucine
M Met Methionine
N Asn Asparagine
P Pro Proline
Q Gln Glutamine
R Arg Arginine
S Ser Serine
T Thr Threonine
V Val Valine
W Trp Tryptophan
X Xxx Unknown
Y Tyr Trrosine
Z Glx Glutamic acid or Glutamine
각각의 아미노산은 아미노(amino) 그룹과 카복실(carboxyl) 그룹으로 구성되어 있다. 아미노산들은 펩타이드 결합(peptide bond)이라는 화학적 사슬을 인접한 아미노산의 아미노산 그룹과 카복실 그룹 사이에 형성한다. 20개의 아미노산은 각각 기본 골격에서 돌출된 상이한 곁사슬을 가지고 있으며 이러한 곁사슬의 화학적 속성들은 단백질의 속성을 결정하는데 중요하다.
단백질은 보통 DNA보다 복잡한 3차원의 구조를 가지고 있다. 펩타이드 결합은 매우 자유롭게 순환할 수 있기 때문에 단백질은 다양한 3차원 구조를 형성할 수 있다. DNA의 이중 나선(double helix)과는 달리 단백질은 다양하고 상이한 형태로 접혀지는 경향이 있으며 함께 조합된 아미노산은 한 개 또는 그 이상의 가닥을 구성하고 있다.
가닥을 구성하고 있는 아미노산의 서열을 1차 구조(the primary structure)라고 하며 지엽적인 구조를 형성하고 있는 나선(helices)이나 베타 가닥(beta-strands) 또는 회전(turns)과 같은 구조를 2차 구조(the secondary structure)라고 한다.
다음 단계의 결합(folding)이나 조합을 3차와 4차 단백질 구조라 한다.
2차 구조 또는 더 상위 구조의 데이터보다는 일차적인 서열 데이터가 훨씬 많다. 사실 1차 단백질 서열 데이터는 수없이 많다(이는 DNA로부터 1차 단백질의 서영을 확인하는 것이 상대적으로 쉽기 때문이다).
Reference
James D. Tisdall, Beginning Perl for Bioinformatics, O'Reilly, 박현석 역, 펄로 시작하는 바이오인포매틱스, 한빛미디어