/*

 http://sosal.kr/
 * made by so_Sal
 */

 


 

- https://www.biostars.org/p/47022/

 

Open Reading Frame (ORF) vs Coding sequence (CDS)

 

 

 

 

- Open reading frame

DNA sequence는 6가지 reading frame이 존재한다.

[ATG][CAT]GC

A[TGC][ATG]C

AT[GCA][TGC]

Double strand로 존재하기 때문에, 상보서열까지 총 6가지의 경우의 수가 존재한다.

 

이 모든 reading frame에서 존재할 수 있는 Start codon 'ATG' (not always) 에서부터 Stop codon (TAA, TAG, TGA)으로 둘러쌓인 sequence를 ORF라고 할 수 있다. 'Protein coding region'의 가능성을 가진 위치를 뜻한다.

 

하지만 이 지역이 실제로 protein으로 발현되는 서열인지, 혹은 다른 RNA를 발현하는 위치인지, 혹은 non-coding region인지는 알 수 없다. 단지 특정 유전체에서 유전자를 찾기 위해 검색해보는 첫번째 단계이다. protein coding region은 start codon과 stop codon으로 둘러쌓여있기 때문이다.

 

 

- Coding Sequence (CDS)

Coding sequence는 실제로 단백질로 발현되는 DNA 지역이다. 위 그림에서 보듯 CDS는 실제 유전체에서 Intron이 모두 제거되고 Exon들이 연결된 서열이며, 이것이 결국 3개의 nucleotide, 코돈 단위로 아미노산으로 번역된다.

mRNA 서열은 하나의 CDS 서열 전체를 포함한다.

 

 

 

 

저작자 표시 비영리 변경 금지
신고
Posted by sosal sosal

댓글을 달아 주세요

  1. 2016.04.11 20:24

    비밀댓글입니다