單細(xì)胞RNA測(cè)序技術(shù)(scRNA-seq)揭示了單個(gè)細(xì)胞的基因表達(dá)情況,單細(xì)胞ATAC測(cè)序技術(shù)(scATAC-seq)專注于單個(gè)細(xì)胞的染色質(zhì)開放性,顯現(xiàn)了細(xì)胞內(nèi)的基因調(diào)控情況。兩種技術(shù)結(jié)合使用可以更好地推斷細(xì)胞內(nèi)部的基因調(diào)控網(wǎng)絡(luò)。但是這些數(shù)據(jù)的分析經(jīng)常要使用不同分析工具分別進(jìn)行。例如,對(duì)于scRNA-seq數(shù)據(jù)一般使用Seurat包分析,而scATAC-seq數(shù)據(jù)則使用ArchR包來(lái)進(jìn)行分析和軌跡推斷,對(duì)轉(zhuǎn)錄因子(transcription factors,TFs)的活性估測(cè)則由chromVAR包進(jìn)行,諸如此類。這使得對(duì)單細(xì)胞基因調(diào)控網(wǎng)絡(luò)的分析變得十分復(fù)雜和不便。
基于這些問題, scMega這樣一個(gè)整合了多種現(xiàn)有數(shù)據(jù)分析方法的多組學(xué)分析工具應(yīng)運(yùn)而生。該工具包含了數(shù)據(jù)整合、細(xì)胞配對(duì)、推斷偽時(shí)間軌跡、TFs篩選、定量基因調(diào)控網(wǎng)絡(luò)和增強(qiáng)子TFs-基因互作識(shí)別。
具體而言,scMega可分為三個(gè)主要步驟:
①單細(xì)胞多組學(xué)數(shù)據(jù)整合,候選TFs和基因的識(shí)別與篩選和基因調(diào)控網(wǎng)絡(luò)分析。在單細(xì)胞多組學(xué)數(shù)據(jù)整合中,利用Seurat的典型相關(guān)分析(CCA)將scRNA-seq數(shù)據(jù)與scATAC-seq數(shù)據(jù)進(jìn)行整合,如果存在批次效應(yīng),再利用Harmony進(jìn)行校正,使用后OptMatch將scRNA-seq與scATAC-seq的細(xì)胞進(jìn)行匹配,構(gòu)建一個(gè)偽多模態(tài)數(shù)據(jù)(圖1a)。
②接下來(lái),scMega利用該多模態(tài)數(shù)據(jù)識(shí)別候選TFs和基因。首先,使用AchR推斷偽時(shí)間軌跡(圖1b),然后根據(jù)染色質(zhì)可及性譜估計(jì)TFs的結(jié)合活性,使用chromVAR計(jì)算TFs結(jié)合活性與TFs表達(dá)之間的相關(guān)性,具有高相關(guān)性說(shuō)明該TF既高表達(dá),其模體又具有更高的可及性(圖1c)。另外,scMega還會(huì)根據(jù)基因在偽時(shí)間軌跡上的表達(dá)變化篩選出軌跡相關(guān)基因(圖1d)。
③最后,在scMega的基因調(diào)控網(wǎng)絡(luò)分析中,當(dāng)一個(gè)基因與至少一個(gè)增強(qiáng)子相關(guān)聯(lián),且某個(gè)TF與這些增強(qiáng)子中的至少一個(gè)結(jié)合時(shí),這個(gè)基因被認(rèn)為是這個(gè)TF的靶點(diǎn),其相互作用按其相關(guān)性進(jìn)行加權(quán),由此得到基于增強(qiáng)子的基因調(diào)控網(wǎng)絡(luò)(圖1e)。
而在真實(shí)數(shù)據(jù)的實(shí)驗(yàn)中,使用了人類外周血單核細(xì)胞的單細(xì)胞多模態(tài)數(shù)據(jù),首先進(jìn)行數(shù)據(jù)整合和細(xì)胞配對(duì),配對(duì)結(jié)果雖然真實(shí)的細(xì)胞對(duì)只有少數(shù)被配對(duì)成功,但同一類型的細(xì)胞基本都匹配在一起。隨后分別基于真實(shí)的細(xì)胞對(duì)和計(jì)算匹配的細(xì)胞對(duì)進(jìn)行基因調(diào)控網(wǎng)絡(luò)分析,有75%的TFs,83%的基因和60%的TF-基因調(diào)控單元重合,說(shuō)明大多數(shù)真實(shí)的互作關(guān)系可以由scMega復(fù)原。
另外的,對(duì)人類心臟心肌梗塞后的纖維細(xì)胞進(jìn)行分析,構(gòu)建了一條在成纖維細(xì)胞亞群內(nèi)的偽時(shí)間軌跡,并推斷了基因調(diào)控網(wǎng)絡(luò),識(shí)別了祖細(xì)胞和肌成纖維細(xì)胞亞群內(nèi)的TF-基因調(diào)控對(duì),在空間轉(zhuǎn)錄組數(shù)據(jù)中對(duì)這些TF的靶基因進(jìn)行空間表達(dá)檢測(cè),也顯示了在心臟纖維化區(qū)域內(nèi)靶基因表達(dá)存在梯度與互斥的現(xiàn)象(圖2)。scMega對(duì)于分析結(jié)果也具有良好的可視化方法,在網(wǎng)絡(luò)圖中每個(gè)節(jié)點(diǎn)代表一個(gè)TF或靶基因,TF節(jié)點(diǎn)的顏色代表了其在偽時(shí)間上的位置,而相連接的節(jié)點(diǎn)為與該TF相關(guān)的靶基因,可見不同的TF在特定細(xì)胞亞群中成簇(圖3a);在曲線圖中,可見不同TF的結(jié)合活性、表達(dá)和靶基因表達(dá)在細(xì)胞分化軌跡上的變化(圖3b)。
ScMega對(duì)于scATAC數(shù)據(jù)的分析和解讀提供了一條非?尚星腋咝У姆治龇桨福沟胹cATAC和scRNA數(shù)據(jù)的聯(lián)合分析更加簡(jiǎn)單,如果您上手有scATAC數(shù)據(jù)而發(fā)愁,不妨一試。