數(shù)據(jù)分析:代謝組學(xué)文獻(xiàn)分享,結(jié)合MATLAB 2018a和SciPy工具進行OnPLS方法統(tǒng)計建模,以期發(fā)現(xiàn)這六類數(shù)據(jù)間的含量表達(dá)相關(guān)性,通過篩選出強相關(guān)信息找出哮喘病人口服類固醇治療前后這些數(shù)據(jù)的含量變化規(guī)律,為后續(xù)進一步闡明哮喘病人的發(fā)病機制提供有力理論數(shù)據(jù)支撐。
3代謝組學(xué)文獻(xiàn)分享—分析流程
通過使用OnPLS方法對上述六類數(shù)據(jù)分析模塊進行統(tǒng)計建模,結(jié)合得分圖發(fā)現(xiàn)樣本組間區(qū)分差異,然后再利用MB-VIOP指標(biāo)對關(guān)鍵變量進行篩選,代謝組學(xué)文獻(xiàn)分享,最后使用可視化和弦圖對引起疾病變化的不同模塊關(guān)鍵變量進行直觀展示和關(guān)聯(lián)分析。
4代謝組學(xué)文獻(xiàn)分享—結(jié)果與討論
OnPLS的數(shù)據(jù)結(jié)構(gòu)
globally joint structures:全局多元數(shù)據(jù)間關(guān)系;
locally joint structures:局部多元數(shù)據(jù)間關(guān)系;
unique structures:單個多元數(shù)據(jù)內(nèi)在關(guān)系;
residual noise structures:系統(tǒng)噪音誤差。
OnPLS模型運算參數(shù)表
表2. 模型共產(chǎn)生7個成分,2個globally joint成分,5個locally joint成分。其中,脂肪酸、氧化脂類和鞘脂類累計貢獻(xiàn)率均超過70%以上,相反,代謝、轉(zhuǎn)錄和臨床數(shù)據(jù)表達(dá)貢獻(xiàn)水平一般。
OnPLS模型相關(guān)性圖
圖為OnPLS模型七個成分的得分值與臨床指標(biāo)數(shù)據(jù)的spearman相關(guān)系數(shù)。代謝組學(xué)文獻(xiàn)分享,紅色表示正相關(guān),藍(lán)色表示負(fù)相關(guān),透明度和圈的大小反應(yīng)相關(guān)程度的強弱,其中,黑色方框標(biāo)記的表示p<0.05,顯著相關(guān)。從圖中可以明顯發(fā)現(xiàn),除性別與第一成分得分呈現(xiàn)顯著負(fù)相關(guān)外,其它臨床指標(biāo)均與第一成分得分表現(xiàn)為顯著正相關(guān)關(guān)系。
OnPLS模型得分和載荷圖
圖A. 在H-PCA(hierarchical PCA)模型得分圖第一主成分上,正常組和哮喘病組有明顯區(qū)分,而在第二主成分上,不同性別間則呈現(xiàn)出較明顯區(qū)分,同時對應(yīng)第一主成分箱線圖也直接表明不同男性患病情況波動較大。
圖B. 與之前模型相關(guān)性圖和得分圖結(jié)果趨勢一致,載荷圖中第一主成分和第二主成分上的相關(guān)變量對樣本分組貢獻(xiàn)也比較大,脂類物質(zhì)的影響尤為顯著。
MB-VIOP關(guān)鍵變量篩選
圖A中,使用MB-VIOP>1對第一主成分上的六類不同數(shù)據(jù)篩選處理得出一些關(guān)鍵的變量,其中除轉(zhuǎn)錄組數(shù)據(jù)外,紅色標(biāo)記的變量表示通過卡值差異篩選,考慮到轉(zhuǎn)錄組數(shù)據(jù)量大的原因,本文將第一主成分的轉(zhuǎn)錄組數(shù)據(jù)差異篩選設(shè)定為2。
圖B中,使用MB-VIOP>1對第二主成分上的五類不同數(shù)據(jù)篩選處理得出一些關(guān)鍵的變量,其中除轉(zhuǎn)錄組數(shù)據(jù)外,紅色標(biāo)記的變量表示通過卡值篩選,為了進一步減少轉(zhuǎn)錄組數(shù)據(jù)受疾病-性別因素的影響,本文將第二主成分的轉(zhuǎn)錄組數(shù)據(jù)差異篩選提高到了2.5。
注:MB-VIOP:Multi-block Variable Influence on Orthogonal Projections。
第一主成分上關(guān)鍵變量篩選
紅色:臨床差異信息,灰色:轉(zhuǎn)錄組學(xué)差異信息,綠色:代謝組學(xué)差異信息,黃色:差異鞘脂類,藍(lán)色:差異脂肪酸,橙色:差異氧化脂類,數(shù)字:連接度,黃色連線:正相關(guān),紫色連線:負(fù)相關(guān),藍(lán)色節(jié)點:含量在哮喘病人中上升,紅色節(jié)點:含量哮喘病人中下降。
圖A可以發(fā)現(xiàn),在與影響生理調(diào)節(jié)重要轉(zhuǎn)錄因子NPAS2具有顯著相關(guān)的五個代謝物中,四個均屬于神經(jīng)酰胺類,值得注意的是,此前未有這方面的報道。代謝組學(xué)文獻(xiàn)分享,由此推測,神經(jīng)酰胺類的物質(zhì)變化可能會對發(fā)病產(chǎn)生一定的影響。
第二主成分上關(guān)鍵變量篩選
紅色:臨床差異信息,灰色:轉(zhuǎn)錄組學(xué)差異信息,綠色:代謝組學(xué)差異信息,黃色:差異鞘脂類,橙色:差異氧化脂類,數(shù)字:連接度,黃色連線:正相關(guān),紫色連線:負(fù)相關(guān),白色節(jié)點:含量在女性組中上升,黑色節(jié)點:含量男性組中上升。
圖B可以看出,PCDH10和LOC284219與氧化脂類呈現(xiàn)了非常明顯的強相關(guān)性,進而推斷這兩個轉(zhuǎn)錄因子在患病的情況下,對氧化脂類的代謝具有較大的影響。
5代謝組學(xué)文獻(xiàn)分享—結(jié)論
通過建立OnPLS方法可以有效將多個不同組學(xué)的聯(lián)合起來進行分析。
代謝組學(xué)文獻(xiàn)分享,結(jié)合可視化分析圖表和MB-VIOP指標(biāo)可以實現(xiàn)幫助找到與疾病發(fā)生密切相關(guān)的一些關(guān)鍵基因,如ATP6,V1G1等,為進一步闡明哮喘病人骨密度下降發(fā)病機理提供強有力的理論支持。
6個人觀點
本文針對多個不同組學(xué)數(shù)據(jù)聯(lián)合分析,提供了比較完整的數(shù)據(jù)分析過程和清晰的關(guān)鍵變量篩選標(biāo)準(zhǔn)。
為了更深入的研究哮喘發(fā)病相關(guān)機制,文章可考慮從代謝通路,網(wǎng)絡(luò)互作,分子實驗等方法進行后續(xù)分析驗證。