"De novo" 測序技術是生物信息學中的一種技術,主要用于確定新的或未知的蛋白質或肽段的氨基酸序列。與重復測序相比,這項技術特別關注那些尚未被鑒定或者在已有數據庫中沒有的蛋白質或肽段。
一、 為什么需要De novo測序?
盡管存在大量的已知蛋白質序列數據,但仍然有大量的蛋白質和肽段的序列和功能尚未被發(fā)現。De novo測序可以幫助研究人員揭示這些尚未鑒定的蛋白質或肽段的氨基酸序列。
二、如何進行De novo測序?
De novo測序主要依賴質譜技術,特別是串聯(lián)質譜 (Tandem Mass Spectrometry, MS/MS)。在該技術中,肽段被電離并進入質譜儀,在那里它們被進一步分裂成較小的碎片。這些碎片的質量被測量并用于推斷原始肽段的氨基酸序列。
三、解析未知肽段的結構與功能:
1、結構解析:
通過De novo測序得到的氨基酸序列可以被用于預測蛋白質的三維結構,F代的蛋白質結構預測算法,如AlphaFold,已經可以基于氨基酸序列準確地預測蛋白質的三維結構。
2、功能解析:
一旦得到了肽段或蛋白質的結構信息,研究人員可以進一步進行功能實驗,如結合實驗、酶活性測定等,來確定其生物學功能。此外,通過與已知蛋白質或功能域的比較,也可以推測其功能。
圖1
四、De novo測序的挑戰(zhàn):
1、碎片解析的復雜性:
根據碎片的質量推斷原始肽段的序列是復雜的,并且可能會有多種可能的序列。
2、長肽段的測序難度:
長肽段可能會產生大量的碎片,這使得序列推斷更加困難。
3、數據量大:
De novo測序產生的數據量通常很大,需要強大的計算能力和專業(yè)的軟件來分析。