Major Study./Bioinformatics

TCGA Somatic mutation

sosal 2015. 12. 26. 08:02
반응형

 

/*

 http://sosal.kr/
 * made by so_Sal
 */

 


Cancer와 관련된 공개서열 데이터에서 가장 유명한 TCGA (The Cancer Genome Atlas)에서는

Somatic mutation data를 특정한 포맷으로 제공한다.

 

 

- LINK

https://wiki.nci.nih.gov/display/TCGA/Mutation+Annotation+Format

MAF (Mutation Annotation Format) 파일로서 제공된다.

 

TCGA data portal에서 직접 검색하여 받을 수 있지만,

MAF 파일은 https://wiki.nci.nih.gov/display/TCGA/TCGA+MAF+Files

에서 매우 쉽게 파일의 정보들과 데이터 파일의 링크를 찾아볼 수 있다.

 

 

 

 

BRCA 예와 같이 하나의 Cancer에서 Center, version, curated 유무 등에 따라 다양한 maf 파일을 제공한다.

권한이 있는 경우, CGHub에서 실제 Raw 데이터인 BAM 파일을 받아볼 수 있다.

https://browser.cghub.ucsc.edu

 

 

실제 Germline mutation은 생식세포에서 Reference와 다른 mutation을 의미하지만,

생식세포의 데이터를 구하기가 어려우므로, Blood normal을 사용하고

Primary Solid Tumor 비교하여 Somatic mutation을 도출하게 된다.

 

 

 

 

Normal data는 일반적으로 Blood Derived Normal,

Tumor data는 보통 Primary Solid Tumor 데이터를 사용하여 Somatic mutation을 도출하게 됩니다.