Cancer와 관련된 공개서열 데이터에서 가장 유명한 TCGA (The Cancer Genome Atlas)에서는
Somatic mutation data를 특정한 포맷으로 제공한다.
- LINK
https://wiki.nci.nih.gov/display/TCGA/Mutation+Annotation+Format
MAF (Mutation Annotation Format) 파일로서 제공된다.
TCGA data portal에서 직접 검색하여 받을 수 있지만,
MAF 파일은 https://wiki.nci.nih.gov/display/TCGA/TCGA+MAF+Files
에서 매우 쉽게 파일의 정보들과 데이터 파일의 링크를 찾아볼 수 있다.
BRCA 예와 같이 하나의 Cancer에서 Center, version, curated 유무 등에 따라 다양한 maf 파일을 제공한다.
권한이 있는 경우, CGHub에서 실제 Raw 데이터인 BAM 파일을 받아볼 수 있다.
https://browser.cghub.ucsc.edu
실제 Germline mutation은 생식세포에서 Reference와 다른 mutation을 의미하지만,
생식세포의 데이터를 구하기가 어려우므로, Blood normal을 사용하고
Primary Solid Tumor 비교하여 Somatic mutation을 도출하게 된다.
Normal data는 일반적으로 Blood Derived Normal,
Tumor data는 보통 Primary Solid Tumor 데이터를 사용하여 Somatic mutation을 도출하게 됩니다.
'Major Study. > Bioinformatics' 카테고리의 다른 글
The 10th GDA, 유전체 데이터 분석 워크샵, 2/22-26 (0) | 2016.01.27 |
---|---|
haplotype과 GATK HaplotypeCaller (0) | 2016.01.26 |
유전체의학 Genomics 수업 정리 (0) | 2015.11.02 |
bayes rule - 베이즈 정리 (0) | 2015.10.08 |
snpEff: predicting the effects of SNP (0) | 2015.10.07 |