본문 바로가기

HMM

Gene Finding과 HMM Advantage and Disadvantage Hidden Markov Model(HMM)를 응용하면 유전자의 서열을 정렬하는 문제에도 적용할 수 있다. 서열을 정렬하는 문제에 HMM을 적용하기 위해서는 여기에 맞는 모델(Model)을 정의해야 하는데, 모델을 정의하기 위해서는 특정 상태에서 심벌(symbol)을 방출할 확률, 상태 사이의 변환 확률을 알고 있어야 한다. 그리고, 여기서도 기존의 서열 정렬에 사용되었던 다이나믹 프로그래밍(Dynamic Programming)이 적용될 수 있다. 즉, 2개의 서열을 정렬한다면, 가장 가능성이 높은 정렬 상태를 찾아야 하며, 이것은 HMM 문제로 변환할 수 있다. 예를 들어 어떤 유전자 서열 _ATTGTA_GC라는 것과 TAATGTAACC가 주어졌다고 했을 때, 이것을 어떻게 표현할 수 있을까? 간단하게.. 더보기
Hidden Markov Model 1 HMM(Hidden Markov Model)은 강력한 통계학적 분석 방법이다. HMM으로 해결할 수 있는 유형의 문제는 Evaluation Problem, Decoding Problem, Learning Problem 세가지이다. Hidden이라는 이름이 붙은 이유는, 관찰자는 오로지 특정 상태에서 방출되는 기호들을 관찰할 수 있을 뿐이며, 기호가 어떤 상태에서 방출된 것인지 알 수 없기 때문이다. (즉, HMM이 현재 어떤 상태인지 알 방법이 없다) 예를 들어, 카지노(Casino)에서 주사위 던지기 게임을 한다고 했을 때, 이 카지노의 딜러(Dealer)는 언제나 공정한 주사위를 사용하지 않는다고 하자. 딜러는 가중치가 적용된 주사위와 공정한 주사위를 번갈아가며 사용한다. 여기서 결과로 얻어진 시퀀스.. 더보기