如何使用TCGAbiolinks分析TCGA中的表達譜數據
這篇文章主要講解了“如何使用TCGAbiolinks分析TCGA中的表達譜數據”,文中的講解內容簡單清晰,易于學習與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學習“如何使用TCGAbiolinks分析TCGA中的表達譜數據”吧!
成都創新互聯公司是專業的湖州網站建設公司,湖州接單;提供成都網站設計、網站建設,網頁設計,網站設計,建網站,PHP網站建設等專業做網站服務;采用PHP框架,可快速的進行湖州網站開發網頁制作和功能擴展;專業做搜索引擎喜愛的網站,專業的做網站團隊,希望更多企業前來合作!
對于轉錄組數據而言,差異分析和富集分析是最核心的分析內容之一,通過TCGAbiolinks可以輕松實現TCGA表達譜數據的下載,差異分析,富集分析等功能,以乳腺癌的基因表達譜為例,分析過程如下
1. 下載原始數據
由于TCGA中乳腺癌的樣本很多,所以只挑選了部分樣本來測試,下載的過程如下
2. 差異分析
詳細步驟如下
對數據進行預處理,根據樣本間的斯皮爾曼相關系數去除相關性較低的樣本
歸一化,調用了EDASeq中的歸一化算法
篩選基因,根據表達量的均值進行篩選
差異分析,調用了edgeR中的差異算法
代碼如下
3. 富集分析
代碼如下
可視化的結果如下所示
GO的3大類別加上kegg pathway共4個類別的數據,對應4張柱狀圖,每個柱狀圖展示的是FDR值最顯著的top10個條目,橫坐標我-log10(FDR), 散點代表的是GeneRatio, 也稱之為enrich factor, 代表富集到該通路下的差異基因個數占該通路下所有基因總數的比例。
感謝各位的閱讀,以上就是“如何使用TCGAbiolinks分析TCGA中的表達譜數據”的內容了,經過本文的學習后,相信大家對如何使用TCGAbiolinks分析TCGA中的表達譜數據這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是創新互聯,小編將為大家推送更多相關知識點的文章,歡迎關注!
新聞名稱:如何使用TCGAbiolinks分析TCGA中的表達譜數據
文章出自:http://www.xueling.net.cn/article/pgseop.html