/*
* http://sosal.kr/
* made by so_Sal
*/
Microsatellite에 대해서 공부하면서 Microsatellite instability라는 페이퍼를 해석해봤다.
Schlötterer and Harr, 2001, C. Schlötterer, B. Harr
Microsatellite Instability. Encyclopedia of Life Sciences
Nature Publishing Group, London (2001) pp. 1–4
Microsatellite는 고등 생물의 유전체에서 아주 흔하게 발견되는 짧은 반복서열이다.
Short tandem repeats(STRs), Simple sequence, Microsatellite 모두 함께 사용할 수 있는 용어이다.
특히 mutation rate가 높기 때문에, Genetic marker로서 굉장히 많이 사용된다.
이 반복서열은 반복되는 단위의 길이에 따라서 mono-, di-, tri-, tetra-, penta-, hexanucleotide repeat로 분류된다.
이 반복서열 안에서도 base substitution에 의한 imperfect microsatellite, insertion에 의한 interrupted microsatellite 등이 존재할 수 있으며, 둘 이상의 repeat unit이 있는 경우에 compound microsatellite로 불린다.
Genomic Distribution
Microsatellite는 Enchromatin에 주로 분포되어 있으며, Heterochromatin에는 적게 관찰된다. 이는 satellite DNA나 minisatellite와는 다른 특성으로, 이는 genome mapping에 아주 효과적으로 사용된다.
(세포 핵에서 활성도에 따라서 DNA는 Heterochromatin과 Euchromatin 2가지 형태로 존재한다.
Heterochromatin은 핵 주위를 감싼 형태로 어둡게 관찰된다. Euchromatin에 비해서 전사 등의 세포내 활성도가 매우 낮은 편이다.)
유전체에서 Microsatellite의 분포는 통계적으로 cluster를 형성하는 경향을 보이며, 그 빈도는 반복 횟수에 반비례 한다.
반복횟수가 많은 microsatellite는 잘 없지만, 통계적으로 random distribution에 비해 유의하게 많이 관찰된다.
그중에서도 Tri-, Hexanucleotide 형태의 Microsatellite가 많이 발견되는데, 이는 의외로 conserved 되어있으며 이는 보통 frame shift issue에 의한 것으로 설명된다.
서열의 repeat type에서 nucleotide 구성 역시 microsatellite을 나누는 주요한 요소이다.
포유동물에서는 (GT/CA)n이 가장 많이 발견되며, (CT/GA)n의 수는 상대적으로 적다. 하지만 예쁜꼬마선충에서는 (CT/GA)가 가장 많이 발견되는 microsatellite nucleotide이다. 이처럼 종에 따라서는 conserved 되어있지 않지만 가까운 분류군에서는 거의 conserved 되어있으며, 이러한 특성 덕분에 Microsatellite는 Genetic marker로서 아주 유용하게 쓰인다.
Microsatellite Mutational Process and Rate
유전체에서 가장 많이 관찰되는 mutation은 바로 one base substitution이다. microsatellite에서도 역시 이 mutation이 쌓일 수 있지만, 더욱 많이 노출되는 mutational process는 바로 DNA replication에서 일어나는 sliipage mutation이다.
Microsatellite는 반복서열이기 때문에, 새로 합성되는 서열의 일부분이 loop out 되더라도 상보서열을 이룬다.
위 그림에서 3번째 코돈 위치의 CAG가 분명 loop out이 되었는데도 불구하고, 반복적인 microsatellite 서열에 의해 주형과 상보서열을 이루기 때문에 double strand pair를 이루고 있다. 주형에 이러한 loop out이 일어나면 서열이 짧아지게 되며, 새로 합성되는 서열에 loop out이 일어나면 서열이 길어지게 된다.
- one repeat unit의 loop out에 의한 결과
따라서 repeat이 많을 수록 mutation이 더 많을 수 밖에 없으며, 실제로 repeat number에 대한 mutation rate는 linear function보다 더 높게 증가한다. 당연하겠지만, di, tri, tetra에 따라서 mutation rate는 다 다르게 나타난다.
trinucleotide repeat의 확장때문에 발생하는 여러가지 신경 퇴행성 질환들이 존재한다. 특히 tri- 의 경우에 loss보다 gain이 유의하게 많이 일어나는데, 그 이유는 loop out된 sequence가 hairpin을 이룰 수 있기 때문에, 다른 repeat보다 더욱 안정한 구조를 가질 수 있기 때문이다.
- Trinucleotide repeat의 Expansion 매커니즘 및 오카자키 절편에서의 Microsatellite expansion
(CAG/GTC)n, (CGG/GCC)n repeat이 길이에 비해 가장 안정한 2차구조를 이루기 때문에, expansion을 가장 많이 일으킨다.
예를 들어 (GT/CA)n가 2차구조를 이루기 위해서는 130 repeat이 필요하지만, (CAG/GTC)n의 경우에는 30~50개만 있어도 충분히 2차구조를 형성한다고 알려져있다.
Phenotypic consequences of Microsatellite expansions
Expansion을 일으키지 않는 Microsatellite의 길이 다양성이 phenotype에 영향을 주느냐는 아직 밝혀지지 않았다.
하지만 Expansion을 일으키는 Trinucleotide repeat으로 부터 Microsatellite variation이 phenotype에 영향을 끼친다는것은 사실이다.
Expansion Microsatellite를 가진 사람은 대부분 신경퇴행성 질환을 겪고있다. 어떤 위치에 이러한 expansion이 일어냐느냐에 따라 질병이 달라진다.
예를 들어 coding sequence에서 일어나는 expanded trinucleotide repeat은Huntington disease, Kennedy disease, spinocerebellar ataxia 등을 일으킨다. 이러한 질병들은 (CAG/GTC)n 반복에 의해 결정되는 Polyglutamine의 gain of function에 의한 결과이다.
Promoter region에서 일어나는 반복에 의한 질병은 fragile X, jocabsen syndrom 등이 있다. 이것은 (CGG/GCC)n repeat에 CG dinucleotide가 메틸화 되어 유전자의 전사를 방해하는 Loss of function에 의한 결과이다.
Microsatellite는 Euchromatic genome 전체에 퍼져있으며 variability가 높은 이유로 genetic map을 구성하기 위한 마커로서 사용되어져 왔다. 최근에는 유전자 포렌식, 친자확인, 연관성 조사, population genetics, Phylogenetic analysis 등에 많이 이용되고 있다.
'Major Study. > Journal study' 카테고리의 다른 글
지식펜 강의 - 연구계획서 작성 방법 (0) | 2016.04.15 |
---|---|
VEGF-A Expression correlates with TP53 mutations in NSCLC (0) | 2015.09.27 |
Gene expression data and Survival analysis (0) | 2015.07.16 |
Integrating genomic and transcriptomic and functional data (0) | 2015.07.11 |
MinION nanopore sequencer 를 위한 향상된 데이터 분석 (0) | 2015.06.03 |