Major Study./Bioinformatics

Microarray와 differentially expressed genes (DEG)

sosal 2014. 8. 26. 13:39
반응형

 

/* 

 http://sosal.kr/
 * made by so_Sal
 */



Microarray 데이터 분석의 목표중 하나 Differentially expressed genes (DEG: 차별 발현 유전자)


  

대조군에 비해 실험군의 발현량이 유의하게 증가하거나 감소하는 유전자를 찾기 위한 방법이다.
각 유전자의 발현량을 나타내는 Microarray 데이터에서, 실제 발현량의 차이를 비교하기 위한 기법으로는 T-Test와 ANOVA가 있다.


T-test[T검정]: t-검정은 두 집단 간 평균을 비교하는 통계분석 기법이다. 다시 말해 t-검정은 두 집단 간 평균 차이에 대한 통계적 유의성을 검증하는 방법이다.


ANOVA[분산분석]: 분산분석은 두 개 이상 집단들의 평균을 비교하는 통계분석 기법이다. 다시 말해, 분산분석은 두 개 이상 집단들의 평균 간 차이에 대한 통계적 유의성을 검증하는 방법이다. [네이버 지식백과] 분산분석 (커뮤니케이션 통계 방법, 2012, 커뮤니케이션북스)


하지만, 실제 유전자 발현 데이터의 분포는 T 분포, 혹은 F분포를 정확히 따라가지 않는 경우가 많다.
이를 해결하기 위해 SAM (Significance Analysis of Microarray)라는 방법이 널리 사용된다.




Multiple testing problem (Multiple testing correction.)
- FWER(Family Wise error rate) : prob. of at least one false positive / 너무 과도하게 보정하여 삭제되는 tuple이 매우 많아진다.
- FDR(False Discovery rate) : p의 분포 curve중에 extream value중에 p값을 뽑는 방법 (많이 사용), FDR을 많이 사용함