반응형

Major Study. 162

TCGA Somatic mutation

/* * http://sosal.kr/ * made by so_Sal */ Cancer와 관련된 공개서열 데이터에서 가장 유명한 TCGA (The Cancer Genome Atlas)에서는 Somatic mutation data를 특정한 포맷으로 제공한다. - LINK https://wiki.nci.nih.gov/display/TCGA/Mutation+Annotation+Format MAF (Mutation Annotation Format) 파일로서 제공된다. TCGA data portal에서 직접 검색하여 받을 수 있지만, MAF 파일은 https://wiki.nci.nih.gov/display/TCGA/TCGA+MAF+Files 에서 매우 쉽게 파일의 정보들과 데이터 파일의 링크를 찾아볼 수 있다. ..

윈도우에서 하드디스크 인식하는법

/* * http://sosal.kr/ * made by so_Sal */ 남아있는 하드디스크가 있어서 데스크탑에 연결했습니다. 이렇게 메인보드에 있는 선과 그냥 단순히 연결만 해주면 끝입니다 ㅋㅋ. 햇빛이 쌔서 사진이 좀 못나왔네요.. 아래에 있는 하드디스크가 새로 추가한 하드입니다. 연결선이 부족하다면 'ATA 포트' 연결선 같은 키워드로 검색하시면 금방 메인보드와 연결할 수 있는 선을 찾으실 수 있으실거에요. 이렇게 새로운 하드디스크를 메인보드에 연결하고, 윈도우를 실행시켜보면.. 내컴퓨터에서 인식이 안되고 있죠. ㅠㅠ 왜냐하면 윈도우에 아무런 하드디스크 정보가 없기 때문에, mount 작업을 따로 거치셔야 합니다. 하지만 윈도우는 사용자 인터페이스가 굉장히 편리하기 때문에 디스크 관리를 통해 아주..

유전체의학 Genomics 수업 정리

n개의 allele이 존재하는 locus에서 나타날 수 있는 유전형의 수 n -> nH2 (중복조합) 2 = 2+1 3 -> 3+2+1 4 = 4+3+2+1 n = n(n+1)/2 allele이 n개: homozygote: n개 : heterozygote: nC2 -> 따라서 유전형의 수는 n + n*(n-1)/2 = n(n+1)/2개 ex) 혈액형의 경우 Allele은 3개이다. 따라서 나타날 수 있는 유전형의 수는 6개다. -> AA, AB, AO, BB, BO, OO (하지만 dominant allele인 A, B에 의해서 표현형은 A, B, O 3가지만 나타나게 된다.) * Genotype Frequency AA:7 AO:27 BB:5 BO:22 AB:12 OO:27 allele, number, ..

Putty에서 mysql encoding 한글이 깨질 때

/* * http://sosal.kr/ * made by so_Sal */ * Mysql character set (Encoding) 보는법 mysql> show variables like 'c%'; 사용자 환경설정이 모두 latin으로 되어있다. * Table structure information 보는법 mysql> show create table member; 사용자 환경 character set 역시 latin1이고, 테이블의 charset 역시 latin1인데 막상 한글이 들어가있는 테이블의 내용을 select로 보면 글자는 다 깨진다. 그럴 경우 PuTTY의 Character set을 바꿔줘야 한글이 잘 보인다. Window - Translation 탭에서 Character-set을 ISO-8..

bayes rule - 베이즈 정리

/* * http://sosal.kr/ * made by so_Sal */ 통계 데이터는 다음과 같이 주어졌다고 가정해보자. 유방 X선 검사는 유방암을 진단하는 척도로 사용된다. 10명의 양성반응을 일으키는 여성에서는 1명이 실제로 유방암을 진단받았고, 10만명의 음성반응을 일으키는 여성에서 20명만이 유방암을 진단받았다. 우리는 모든 모집단 정보를 가지고 있기 때문에, 사전확률과 사후확률을 모두 쉽게 구할 수 있다. 사전 확률: 유방암을 진단받기 이전에 유방암을 가질 확률 = (1+20) / (1+20+9+99980) = 21/100010 = 0.000209979.. (즉 0.0209979%) 사후 확률: 유방암에 양성반응으로 진단받은 후에, 유방암을 가질 확률 = (1/9+1) = 1/10 = 0.1..

snpEff: predicting the effects of SNP

/* * http://sosal.kr/ * made by so_Sal */ http://snpeff.sourceforge.net/ Cingolani, Pablo, et al. "A program for annotating and predicting the effects of single nucleotide polymorphisms, SnpEff: SNPs in the genome of Drosophila melanogaster strain w1118; iso-2; iso-3." Fly 6.2 (2012): 80-92. variant의 position, allele 정보를 주면 얼마나 위험한지 HIGH / MODERATE / LOW 3가지로 분류해줍니다. (그 외 MODIFIER) A high impact..

affymetrix cdf 파일, 아무리 찾아도 없다

/* * http://sosal.kr/ * made by so_Sal */ Microarray로 분석을 하고있었다. chip type: HuGene-2_0-st로 작업을 하고 있기에, Affymetrix Power Tool (APT)를 사용하기 위해서는 cdf파일이 input으로 들어가는 상황이었다. - Affymetrix library 파일을 받을 수 있는곳 http://www.affymetrix.com/support/technical/byproduct.affx?product=hugene-1_0-st-v1 그러나 library 파일을 아무리 다운받아봐도 cdf파일이 없었다. bgp, cif, clf, grc, mps, pgf, ps, qcc, smd.. 뭐 이런파일들은 있는데.. 나와 비슷한 사람들이 ..

VEGF-A Expression correlates with TP53 mutations in NSCLC

/* * http://sosal.kr/ * made by so_Sal */ Schwaederlé, Maria, et al. "VEGF-A Expression Correlates with TP53 Mutations in Non–Small Cell Lung Cancer: Implications for Antiangiogenesis Therapy." Cancer research 75.7 (2015): 1187-1190. INTRODUCTION Bevacizumab은 항암제로서 종양에 있어서 많이 사용되는 약물이며 Vascular endothelial growth factor-A (VEGF-A)을 대상으로 한다. Carboplatin, paclitaxel과 결합된 치료법은 실제로 화학요법만 사용했을 때의 생존인..

R - ReadAffy() .CEL file read Error

/* * http://sosal.kr/ * made by so_Sal */ library(limma) library(gcrma) > ReadAffy() Error: The affy package is not designed for this array type. Please use either the oligo or xps package. Cell file 배열 type이 기존의 ReadAffy() 함수로 읽어지는 형태가 아닌가보다. array type에 대해 찾아보려면 찾아볼 수 있지만 귀찮아서 에러에서 말한대로 oligo 패키지를 이용해서 CEL 파일을 읽어들이기로 했다. Bioconductor로 쉽게 설치하면 끝난다. > source("http://bioconductor.org/biocLite.R")..

Survival analysis - Log Rank, Coxph

/* * http://sosal.kr/ * made by so_Sal */ 1. 파일의 구조 및 데이터 정보 2. 생존과 관련된 환자정보 3. LogRank test로 위의 두 그룹이 유의하게 생존에서 차이를 보이는지 확인하기 4. Cox-proprtional harzard regression analysis: 회귀를 이용한 생존분석 Log rank test 독립변수를 통해 group화 된 샘플이, 그룹간에 생존분포 차이가 있는지 확인할 수 있는 가설검정 (hypothesis test) 유의한 결과가 나온다면 즉 해당 독립변수는 prognostic factor로써 좋은 기능을 한다는 것. Cox-proprtional harzard regression analysis 콕스 비례위험모형, 줄여서 coxph라..

반응형