Up regulated / Down regulated gene expression
/*
* http://sosal.kr/
* made by so_Sal
*/
https://www.biostars.org/p/100123/
바이오스타를 뒤적이다가 'Separate enrichment analysis of pathways for up- and downregulated genes' 라는 제목의 글을 봤다.
보통 Gene ontology analysis (혹은 GO analysis)를 할 때, Upregulated gene들 따로, Down-regulated gene들 따로, 전체 따로 등등 뭐 다 돌려보는 편이었고, 발현량 값과 함께 GSEA를 돌리기도 했었다.
실제로 저 up/down에 대한 separate enrichment analysis라는 분석의 논문을 실제로 적용하여 연구한 결과가 몇개 안되긴 하지만, GO 결과가 처참한 case/control 연구 결과에 뭔가 하나라도 더 해볼 수 있는 희망이 되지 않을까 ;;
위 논문에 있는 figure중 하나인데,
ALL DEG, Up-regulated DEG, Down-regulated DEG 3개로 KEGG pathway 분석을 한 결과인데,
(a)는 microarray, (b)는 RNA-Seq 데이터이다. 공통되는 pathway가 하나도 없다.
Number of significant KEGG pathways for five tumour datasets. (a) Venn diagrams for the number of significant KEGG pathways detected by analysing the all-DE, up-DE and down-DE gene lists from the three microarray datasets. (b) Venn diagrams for the number of significant KEGG pathways detected by analysing the all-DE, up-DE and down-DE gene lists from the two RNA-seq datasets. BC denotes breast cancer; CRA denotes colorectal adenomas; GC denotes gastric cancer; KIRC denotes kidney renal clear cell carcinoma; LUAD denotes lung adenocarcinoma. (Online version in colour.)
이를 어떻게 해석해야할지는 모르겠지만..
그냥 적당히 DAVID 돌리는게 답인가 ㅠㅠ
아래와 같은 댓글도 있었다.
Like many others, I always make a heatmap of the expression estimates of all differentially expressed genes arranged by hierarchical clustering. Then I perform ontology analyses on correlated sets of genes.
꼭 Upregulated / Downregulated DEG를 뽑는것 뿐 만 아니라,
distance measure를 1-pearson으로 두고 상관관계가 높은것들끼리 묶어서 clustering을 한 후에
그 cluster gene set을 GO analysis에 넣는 방법도 좋은 것 같다.
만약 Clustering을 하게 된다면 biolattice라는 software도 사용할 수 있는데,
이는 cluster간의 관계를 나타내주는 소프트웨어다.
gene set cluster들간의 관계에서 가장 major한 relation이 무엇인지 알려주기 때문에
GO analysis 이후에 그것이 정말로 enriched 되어있다고 보여주기 위한 또다른 support data로 활용할 수 있다.