/*
* http://sosal.kr/
* made by so_Sal
*/
# install
source("http://bioconductor.org/biocLite.R")
biocLite("biomaRt")
#document
#browseVignettes("biomaRt")
#load & attach package
library(biomaRt)
#Mart list.
listMarts()
# 아직 아는것은 ensembl과 snp밖에 없지만..
ensembl과 snp 2가지 Mart를 이용하여 이번 Rarepedia에서 필요했던 variant, gene, transcript 정보들을 쉽게 가져올 수 있다.
1. rsid를 이용하여 snp 데이터베이스에서 정보 가져오기
attributes.snp <- c("refsnp_id","chr_name","allele", "chrom_start", "chrom_end", "chrom_strand","sift_score","polyphen_score",
"minor_allele","minor_allele_freq","ensembl_gene_stable_id","ensembl_transcript_stable_id",
"consequence_allele_string","consequence_type_tv","ensembl_type")
rs = "rs115940994";
List <- getBM(attributes = attributes.snp, filters="snp_filter", values = rs, mart = SNP)
List
snp MArt에서 rsID를 이용하여 Chr, position, allele, SIFT, Polyphen, MAF와
해당 variant가 속한 ENSG, 그리고 ENST 목록도 뽑아주며 AA change도 알 수 있고, variant type(consequence type)도 알 수 있다.
ex)
주요 feature라고 생각되는 것들은 attributes.snp 변수에 넣었지만, 다른 attributes는
SNP <- useMart("snp", "hsapiens_snp")
#listAttributes(SNP) 로 확인할 수 있다.
2. ENSG를 이용하여 ensembl 데이터베이스에서 정보 가져오기
ensembl_gene <- c("ENSG00000204406")
mart<- useDataset("hsapiens_gene_ensembl", ensembl)
attributes= c("ensembl_gene_id","hgnc_symbol","ensembl_transcript_id","ensembl_peptide_id"
,"refseq_mrna","refseq_peptide","phenotype_description")
List = getBM(filters= "ensembl_gene_id", attributes, values=ensembl_gene, mart= mart)
List
중요한 feature들은
"ensembl_gene_id" "hgnc_symbol" "ensembl_transcript_id" "ensembl_peptide_id" "refseq_peptide" "uniprot_swissprot"
"description" "go_id" "phenotype_description"
정도라고 생각하는데 역시 listAttributes 함수를 이용하여 ensembl의 전체 attributes의 목록을 볼 수 있다.
# ensembl = useMart("ensembl",dataset="hsapiens_gene_ensembl")
#listAttributes(ensembl)
'Programing > R- programming' 카테고리의 다른 글
R - One sample T-test / T 검정 (3) | 2015.02.08 |
---|---|
IQR Rule for Outliers - 이상치 (2) | 2015.02.04 |
R을 이용한 정규분포와 확률밀도함수 (0) | 2014.10.29 |
R 변동계수의 정의와 의미(coefficient of variation) (0) | 2014.10.17 |
R에서 히스토그램(Histogram), 줄기잎그림(stem) (0) | 2014.10.17 |