勵志

勵志人生知識庫

gsea分析

GSEA(Gene Set Enrichment Analysis)即基因集富集分析,是一種用於分析基因表達數據的計算生物學方法,旨在揭示與特定生物學過程、通路或功能相關的基因表達模式。它由Broad Institute研究所提出,並提供對應的分析軟體和一個基因集資料庫MSigdb

GSEA的原理是給定一個排序的基因表和一個預先定義的基因集,通過判斷基因集中的部分在排序的基因表中是隨機分布還是分布於頂端或底端,來判定其是否對表型有貢獻。如果基因集的成員顯著聚集在排序基因表的頂端或底端,則說明其對於表型具有貢獻。

GSEA主要包括三個步驟:計算富集得分(Enrichment Score);估計富集得分的顯著性水平;多重假設檢驗。在實際操作中,可以利用公共資料庫(如Gene OntologyKEGG PathwayReactome等)或研究者自己根據文獻和領域知識構建的基因集進行GSEA分析。同時,GSEA還可以用於分析不同條件或樣本中基因的表達水平,從而確定基因集的富集程度。

與傳統的基因差異分析方法(如t檢驗或ANOVA)相比,GSEA專注於整個基因集的表達趨勢,而不是單個基因的表達差異,因此能夠提供更全面的生物學過程或通路相關的信息。此外,GSEA不需要指定明確的差異基因閾值,而是把基因按照在兩組樣本中的差異表達程度進行排序,然後採用統計學方法檢驗預先設定的基因集合是否在排序表的頂端或底端富集,從而避免了基於超幾何分布的富集分析方法可能出現的問題。