成人欧美一区二区三区黑人免费_亚洲永久无码7777KKK_国产欧美日韩综合精品一区二区_欧美在线一区二区三区

English | 中文版 | 手機版 企業(yè)登錄 | 個人登錄 | 郵件訂閱
當前位置 > 首頁 > 技術文章 > WGCNA分析流程及內(nèi)容解讀

WGCNA分析流程及內(nèi)容解讀

瀏覽次數(shù):926 發(fā)布日期:2024-12-6  來源:本站 僅供參考,謝絕轉(zhuǎn)載,否則責任自負
文章標題:通過 WGCNA 和機器學習識別和驗證與免疫和氧化應激相關的糖尿病腎病診斷標記物
發(fā)表年限:2023年
期刊:Frontiers in Immunology
影響因子:5.7
研究背景:
糖尿病腎�。―N)以蛋白尿、高血壓和腎功能進行性減退為特征,是發(fā)達國家終末期腎病最常見的病因,造成了嚴重的社會和經(jīng)濟負擔。研究表明,隨著全球糖尿病發(fā)病率的上升,DN患者的人數(shù)也在不斷增加,預計在未來20年左右的時間里,全球糖尿病發(fā)病率將從5.37億人上升到7.83億人。與此相反,目前的治療方案強調(diào)腎素-血管緊張素系統(tǒng)阻斷、血壓管理和血糖控制。因此,DN診斷和治療迫切需要新的靶點。近年來,隨著生物信息學的發(fā)展,其研究技術已被積極用于探索包括DN在內(nèi)的多種疾病的靶點。
研究結(jié)果:
本文中,作者使用R軟件包"WGCNA"構建了WGCNA,以識別與糖尿病腎病患者免疫細胞相關性最高的模塊。 具體來說,首先對樣本數(shù)據(jù)進行了預處理,并剔除了異常值。隨后,"WGCNA"軟件包構建了相關矩陣。選擇最佳軟閾值將相關矩陣轉(zhuǎn)換為鄰接矩陣,并根據(jù)鄰接矩陣創(chuàng)建拓撲重疊矩陣(TOM)。利用基于TOM的相異性度量,采用平均關聯(lián)分層聚類將具有相似表達模式的基因歸類為基因模塊。與免疫細胞相關性最強的兩個模塊被選為關鍵模塊,用于后續(xù)分析。
該研究中軟閾值功率校準為0.85(圖B)。最后,WGCNA分析顯示了11個模塊的總和(圖C)。其中,綠色模塊和品紅色模塊分別與T細胞CD4幼稚亞群和γ δ 亞群有很強的正相關性。由于綠色模塊和品紅色模塊與免疫浸潤細胞有重要關聯(lián),因此考慮對這兩個模塊進行進一步研究。
從上述文章中可以看出,WGCNA分析可用于識別高度相關的基因模塊,總結(jié)模塊之間的相互聯(lián)系以及與外部樣本性狀的關聯(lián),并識別候選生物標記物或治療靶點。
WGCNA,全稱為weighted gene co-expression network analysis,即加權基因共表達網(wǎng)絡分析。它是一種分析多個樣本基因表達模式的分析方法,可將表達模式相似的基因進行聚類,并分析模塊與特定性狀或表型之間的關聯(lián)關系,在研究表型性狀與基因關聯(lián)分析等方面的研究中被廣泛應用。
1.數(shù)據(jù)輸入、清洗和預處理
使用R包”WGCNA“進行分析,輸入數(shù)據(jù)一般為fpkm表達量數(shù)據(jù),推薦5組(或者15個樣品)以上的數(shù)據(jù),數(shù)據(jù)的行為基因,列為不同樣本的基因表達量。
2.使用goodSamplesGenes檢查缺失值和識別離群值(異常值)。
如果gsg$allOK的結(jié)果為TRUE,證明沒有缺失值,可以直接下一步。如果為FALSE,則需要用以下函數(shù)進行刪除缺失值。
對所有樣本進行聚類,觀察是否有離群值或異常值,如果有離群值則要刪去離群的樣本。
3. 讀入樣本信息并進行篩選,得到表型數(shù)據(jù)與表達量數(shù)據(jù)二者共有的樣本數(shù)據(jù),并重新構建聚類樹。
顏色越深,代表這個表型數(shù)據(jù)與這個樣本的基因表達量關系越密切。將此步驟的數(shù)據(jù)進行保存,命名為file1。
4.對匹配后的樣本基因表達量數(shù)據(jù)和表型數(shù)據(jù)進行分析,選擇合適的軟閾值構建網(wǎng)絡,并繪制層次聚類樹。
5. 選擇合適的軟閾值構建自動化網(wǎng)絡和檢測模塊,使用sft$powerEstimate查看推薦的軟閾值。
6.為了更清晰地反映出樣本基因的聚類關系,我們將這些基因劃分成了若干個模塊,每個模塊至少存在30個基因,每一個顏色代表一個模塊,將劃分后的模塊和樣本基因的層次聚類樹一起顯示,如下圖所示:
保存模塊信息:file2。
7.載入file1和file2,將性狀信息和模塊信息相關聯(lián),并繪制模塊與性狀之間的相關性熱圖。
圖中紅色為正相關,藍色為負相關,顏色越深則相關性越強。
8.加權網(wǎng)絡可視化
可視化加權網(wǎng)絡的方法之一是制作熱圖。熱圖的每行每列代表一個基因,淺色代表低鄰接;深色代表高鄰接,基因之間的鄰接程度低意味著基因之間的度量值較小,即他們之間之間的相似性較低,這可能表示它們在表達模式、功能或調(diào)控方面存在較大的差異。相反,鄰接程度高表示基因之間的度量值較大,即它們之間的相似性較高。這可能表示它們在表達模式、功能或調(diào)控方面存在相似性。由于樣本的基因數(shù)量較多,我們從中隨機選取了400個基因進行繪圖,圖片如下所示:
9.此外,可以使用分析結(jié)果針對特定模塊繪制相關性網(wǎng)絡圖,還可以將數(shù)據(jù)導入到相關軟件中(如:Cytoscape)進行相關性網(wǎng)絡的可視化。
參考文獻:
[1]Xu M, Zhou H, et al. Identification and validation of immune and oxidative stress-related diagnostic markers for diabetic nephropathy by WGCNA and machine learning. Front Immunol. 2023 Feb 22;14:1084531.
[2]Langfelder P, Horvath S. WGCNA: an R package for weighted correlation network analysis. BMC Bioinformatics. 2008 Dec 29;9:559.
來源:藍景科信河北生物科技有限公司
聯(lián)系電話:15632249798
E-mail:hope.liu@bluescape.cc

用戶名: 密碼: 匿名 快速注冊 忘記密碼
評論只代表網(wǎng)友觀點,不代表本站觀點。 請輸入驗證碼: 8795
Copyright(C) 1998-2025 生物器材網(wǎng) 電話:021-64166852;13621656896 E-mail:info@bio-equip.com
成人欧美一区二区三区黑人免费_亚洲永久无码7777KKK_国产欧美日韩综合精品一区二区_欧美在线一区二区三区
欧美一区二区三区视频在线播放| 国产搡bbb爽爽爽视频| 日本av免费看| 欧美性久久久久久| 日本亚洲色大成网站WWW久久| 性做久久久久久免费观看| 无码人妻精品中文字幕免费时间| 成人久久久久| 国产伦精品一区二区三区综合网 | 99久久精品人妻| 亚洲性色精品一区二区在线 | 野花香视频在线观看免费高清版 | 日韩精品在线观看中文字幕| 日本少妇videos| 国产黄色精品网站| 人人妻人人干人人爽| 7878m成人免费视频| 一进一出好爽视频| 久久一级黄色片| 精品人人爽| av尤物在线| 欧美成人久久| 欧美久久久久久久久久久| 亚洲欧美一区二区三区久久蜜桃| 99精品人妻少妇一区二区三区| 日韩精品一区二区亚洲av性色| 精品人妻无码一区二区三区四川人 | 性视频久久| 日韩精品一区二区av| 成人做受视频试看60秒| 少妇高潮一区二区三区69| 巨大黑人xxxxx高潮后处理| 69久久夜色精品国产69乱青草| 国产精品96久久久久久久| 综合久久av| 播五月色五开开心五月| 911精产国品一二三区在线观看| 午夜男女啪啪| 日韩av一区不卡| 久久亚洲熟妇熟女| 97国产精东麻豆人妻电影|