반응형

Major Study. 162

Microsatellite 반복서열의 기능, 기작 및 특성

/* * http://sosal.kr/ * made by so_Sal */ Microsatellite에 대해서 공부하면서 Microsatellite instability라는 페이퍼를 해석해봤다. Schlötterer and Harr, 2001, C. Schlötterer, B. Harr Microsatellite Instability. Encyclopedia of Life Sciences Nature Publishing Group, London (2001) pp. 1–4 Microsatellite는 고등 생물의 유전체에서 아주 흔하게 발견되는 짧은 반복서열이다. Short tandem repeats(STRs), Simple sequence, Microsatellite 모두 함께 사용할 수 있는 용어이다...

RNASeq 플랫폼 선정원칙 및 플랫폼 주요 특성

/* * http://sosal.kr/ * made by so_Sal */ RNASeq (RNA seqeencing)은 Microarray의 정확도 및 Saturation 문제를 비롯하여 novel transcript, Alternative splicing case 등을 잡아낼 수 있는 장점이 있어서 최근 Transcriptome analysis에서 아주 많이 사용되고 있다. RNASeq 데이터를 생산해내는 플랫폼이 다양하지만, 어떤것을 써야 하느냐에 대한 답은 없다. 일반적으로 PubMed에서 비슷한 실험 및 연구에 사용된 데이터의 플랫폼을 따라가는 것이 쉬운 답이지만 실험의 디자인 및 실험 과정 또한 빠르게 바뀌고 있기 때문에, 따라가는 것 역시 항상 옳은 방법이 될 수 없다. 따라서 일반적인 실험디..

TCGA data FTP, wget을 통해 받는 방법

/* * http://sosal.kr/ * made by so_Sal */ TCGA Data Portal에서는 다양한 데이터를 제공한다. https://tcga-data.nci.nih.gov/tcga/ 웹사이트에서 직접 데이터를 받는것은 아무리 bulk download를 하더라도, 필요없는 데이터까지 한번에 받아야 하며 캔서 type마다 단순반복적인 행동을 해야하기 때문에 좋은 방법이 아닌 것 같다. 리눅스에서 wget으로 원하는 파일만 wildcard를 사용하여 다운받을 수 있기 때문에 FTP를 이용한다면 원하는 파일을 쉽고 빠르게 받을 수 있다. FTP Link - https://tcga-data.nci.nih.gov/tcgafiles/ftp_auth/distro_ftpusers/anonymous/t..

Gene expression data and Survival analysis

/* * http://sosal.kr/ * made by so_Sal */ Springer 2005, Peter J. Park Methods of Microarray Data Analysis IV Gene Expression Data and Survival Analysis http://link.springer.com/chapter/10.1007%2F0-387-23077-7_3 상당히 오래된 문서이지만, Microarray를 사용한 Survival analysis에서 다뤄지는 다양한 알고리즘과 문제점들이 소개된다. Gene expression을 이용한 survival analysis를 공부하면서 살짝 간출여서 정리해보려고 노력해봤다. ABSTRACT. Expression profiles와 Phenotypi..

Integrating genomic and transcriptomic and functional data

/* * http://sosal.kr/ * made by so_Sal */ Suo, Chen, et al. "Integration of somatic mutation, expression and functional data reveals potential driver genes predictive of breast cancer survival." Bioinformatics (2015): btv164. bioinformatics 학회지에 실린 논문. 제목만으로는 평범한 gene scoring 논문인줄 알았는데, 의외로 너무 재밌는 논문이었다. 초록에서는 다음과 같은 문장으로 시작된다. Genome and transcriptome analyses can be used to explore cancers com..

Hg18 데이터 Hg19로 liftover 하기

/* * http://sosal.kr/ * made by so_Sal */ Hg는 UCSC browser에서 사용되는 Human genome reference 명명법입니다. Hg**은 UCSC의 명명법이며, 또 다른 Release name도 가집니다. - List of UCSC genome releases SPECIES UCSC VERSION RELEASE DATE RELEASE NAME STATUS MAMMALS Human hg38 Dec. 2013 Genome Reference Consortium GRCh38 Available hg19 Feb. 2009 Genome Reference Consortium GRCh37 Available hg18 Mar. 2006 NCBI Build 36.1 Availab..

DNA Mutation - 돌연변이의 종류

/* * http://sosal.kr/ * made by so_Sal */ 돌연변이(Mutation): 세포의 DNA를 구성하는 nucleotide가 바뀌는 현상 DNA에서의 돌연변이는 결국 암호화되는 단백질 구조에 기능에 영향을 미치거나, 세포내의 다양한 역할을 하는 RNA의 구조, 기능에 영향을 미쳐 기능의 변화가 유발시킨다. 따라서 생체는 돌연변이를 방지하고 복구하는 기작도 갖추게 되었다. 돌연변이는 크게 체세포 돌연변이(Somatic mutation), 생식세포 돌연변이(Germline mutation)로 구분된다. 체세포 돌연변이는 암유전자 형성 등의 예가 있으며, 해당 세포에만 영향을 주기 때문에 자손에게는 유전되지 않지만, 난자 및 정자에 해당하는 생식세포 돌연변이는 자손에게 유전되므로 종의..

ORF vs Coding sequence (cds) 차이점

/* * http://sosal.kr/ * made by so_Sal */ - https://www.biostars.org/p/47022/ Open Reading Frame (ORF) vs Coding sequence (CDS) - Open reading frame DNA sequence는 6가지 reading frame이 존재한다. [ATG][CAT]GC A[TGC][ATG]C AT[GCA][TGC] Double strand로 존재하기 때문에, 상보서열까지 총 6가지의 경우의 수가 존재한다. 이 모든 reading frame에서 존재할 수 있는 Start codon 'ATG' (not always) 에서부터 Stop codon (TAA, TAG, TGA)으로 둘러쌓인 sequence를 ORF라고 할 수..

MinION nanopore sequencer 를 위한 향상된 데이터 분석

/* * http://sosal.kr/ * made by so_Sal */ Nature Methods지에 실린 논문입니다. NGS 이후에 3세대 Sequencer중에 하나인 MinION Nanopore sequencer로부터 얻은 데이터에 대해 정확한 sequencing을 위한 데이터분석 관련 논문입니다. MinION Nanopore sequencer는 위의 그림처럼 usb크기의 아주 작은 sequencer다. 기존의 NGS sequencer와 달리, 다량의 잘려진 sequence fragment를 읽어들이는 것이 아닌, 하나의 DNA strand 전체를 한번에 읽어들일 수 있다는 장점이 있다. 현재까지는 variant가 아주 많은 부위 [예를들면 면역관련이나 류마티스 관절렴 등등, variant가 아주..

R에서의 Ensembl IDs와 Entrez IDs

/* * http://sosal.kr/ * made by so_Sal */ 옛날에 적은글이라.. bioconductor가 업데이트 되면서 사용법이 바꼈습니다.install만 아래로 해주세요~! if (!requireNamespace("BiocManager", quietly = TRUE)) install.packages("BiocManager") BiocManager::install("org.Hs.eg.db") if (!requireNamespace("BiocManager", quietly = TRUE)) install.packages("BiocManager") BiocManager::install("AnnotationDbi") ############# Ensembl ID 또는 Entrez ID를 알고 있..

반응형