반응형
/*
Microarray 데이터 분석의 목표중 하나 Differentially expressed genes (DEG: 차별 발현 유전자)
대조군에 비해 실험군의 발현량이 유의하게 증가하거나 감소하는 유전자를 찾기 위한 방법이다.
각 유전자의 발현량을 나타내는 Microarray 데이터에서, 실제 발현량의 차이를 비교하기 위한 기법으로는 T-Test와 ANOVA가 있다.
T-test[T검정]: t-검정은 두 집단 간 평균을 비교하는 통계분석 기법이다. 다시 말해 t-검정은 두 집단 간 평균 차이에 대한 통계적 유의성을 검증하는 방법이다.
ANOVA[분산분석]: 분산분석은 두 개 이상 집단들의 평균을 비교하는 통계분석 기법이다. 다시 말해, 분산분석은 두 개 이상 집단들의 평균 간 차이에 대한 통계적 유의성을 검증하는 방법이다. [네이버 지식백과] 분산분석 (커뮤니케이션 통계 방법, 2012, 커뮤니케이션북스)
이를 해결하기 위해 SAM (Significance Analysis of Microarray)라는 방법이 널리 사용된다.
Multiple testing problem (Multiple testing correction.)
- FWER(Family Wise error rate) : prob. of at least one false positive / 너무 과도하게 보정하여 삭제되는 tuple이 매우 많아진다.
- FDR(False Discovery rate) : p의 분포 curve중에 extream value중에 p값을 뽑는 방법 (많이 사용), FDR을 많이 사용함
'Major Study. > Bioinformatics' 카테고리의 다른 글
SAM/BAM 포맷, 구조 분석 (0) | 2014.12.12 |
---|---|
NGS vs Sanger sequencing (10) | 2014.10.21 |
TCGA Data structure & survival analysis (1) | 2014.08.25 |
대용량 FastA file에서 sequence 검색하기 / C# (0) | 2014.08.13 |
Blosum62 Codon table / matrix C++ (0) | 2014.07.24 |