Major Study./Bioinformatics

Up regulated / Down regulated gene expression

sosal 2016. 5. 28. 04:48
반응형

/*

 http://sosal.kr/
 * made by so_Sal
 */

 

https://www.biostars.org/p/100123/

 

바이오스타를 뒤적이다가 'Separate enrichment analysis of pathways for up- and downregulated genes' 라는 제목의 글을 봤다.

Hong, Guini, et al. "Separate enrichment analysis of pathways for up-and downregulated genes." Journal of The Royal Society Interface 11.92 (2014): 20130950.

 

보통 Gene ontology analysis (혹은 GO analysis)를 할 때, Upregulated gene들 따로, Down-regulated gene들 따로, 전체 따로 등등 뭐 다 돌려보는 편이었고, 발현량 값과 함께 GSEA를 돌리기도 했었다.

 

실제로 저 up/down에 대한 separate enrichment analysis라는 분석의 논문을 실제로 적용하여 연구한 결과가 몇개 안되긴 하지만, GO 결과가 처참한 case/control 연구 결과에 뭔가 하나라도 더 해볼 수 있는 희망이 되지 않을까 ;;

 

위 논문에 있는 figure중 하나인데,

ALL DEG, Up-regulated DEG, Down-regulated DEG 3개로 KEGG pathway 분석을 한 결과인데,

(a)는 microarray, (b)는 RNA-Seq 데이터이다. 공통되는 pathway가 하나도 없다.

 

 

Number of significant KEGG pathways for five tumour datasets. (a) Venn diagrams for the number of significant KEGG pathways detected by analysing the all-DE, up-DE and down-DE gene lists from the three microarray datasets. (b) Venn diagrams for the number of significant KEGG pathways detected by analysing the all-DE, up-DE and down-DE gene lists from the two RNA-seq datasets. BC denotes breast cancer; CRA denotes colorectal adenomas; GC denotes gastric cancer; KIRC denotes kidney renal clear cell carcinoma; LUAD denotes lung adenocarcinoma. (Online version in colour.)

 

이를 어떻게 해석해야할지는 모르겠지만..

그냥 적당히 DAVID 돌리는게 답인가 ㅠㅠ

 

 

 

아래와 같은 댓글도 있었다.

Like many others, I always make a heatmap of the expression estimates of all differentially expressed genes arranged by hierarchical clustering. Then I perform ontology analyses on correlated sets of genes.

 

꼭 Upregulated / Downregulated DEG를 뽑는것 뿐 만 아니라,

distance measure를 1-pearson으로 두고 상관관계가 높은것들끼리 묶어서 clustering을 한 후에

그 cluster gene set을 GO analysis에 넣는 방법도 좋은 것 같다.

 

만약 Clustering을 하게 된다면 biolattice라는 software도 사용할 수 있는데,

이는 cluster간의 관계를 나타내주는 소프트웨어다.

gene set cluster들간의 관계에서 가장 major한 relation이 무엇인지 알려주기 때문에

GO analysis 이후에 그것이 정말로 enriched 되어있다고 보여주기 위한 또다른 support data로 활용할 수 있다.

 

Kim, Jihun, et al. "BioLattice: a framework for the biological interpretation of microarray gene expression data using concept lattice analysis." Journal of biomedical informatics 41.2 (2008): 232-241.