圖 1. 藥理活性分子從設(shè)計(jì)到知識(shí)交流和傳遞的開(kāi)發(fā)過(guò)程[1]。
基于 AI 篩選的優(yōu)勢(shì):
1. AI 算法可以篩選龐大的生物數(shù)據(jù)庫(kù),以前所未有的速度和高精度識(shí)別潛在的藥物靶點(diǎn)。
2. 通過(guò)分析從基因組到臨床的所有數(shù)據(jù),AI 工具可以精確定位在疾病進(jìn)展中起關(guān)鍵作用的分子和生物途經(jīng),為研究人員提供關(guān)于潛在治療干預(yù)措施的寶貴見(jiàn)解。
3. 同時(shí)基于 AI 篩選技術(shù)對(duì)大型的化合物庫(kù)數(shù)據(jù)進(jìn)行快速的篩選,以識(shí)別最有可能與靶標(biāo)結(jié)合的化合物,這個(gè)過(guò)程曾經(jīng)耗時(shí)且成本高昂,現(xiàn)在可以在短時(shí)間內(nèi)完成,大大加快了藥物發(fā)現(xiàn)的步伐。
4. 此外,AI 驅(qū)動(dòng)的預(yù)測(cè)模型可以幫助研究人員更準(zhǔn)確的評(píng)估候選藥物的有效性和安全性,從而指導(dǎo)優(yōu)先對(duì)哪些化合物進(jìn)行進(jìn)一步的優(yōu)化和測(cè)試。
02
基于 AI 的藥物發(fā)現(xiàn),如何應(yīng)用?
AI 輔助藥物研發(fā)成功案例
AI 在藥物發(fā)現(xiàn)中的潛力已經(jīng)在很多案例中得到證明。例如,Gupta,R. 等人 2021 年報(bào)道了基于已知癌癥相關(guān)化合物和相應(yīng)的生物活性的大型數(shù)據(jù)集訓(xùn)練了 DL (深度學(xué)習(xí)) 算法,結(jié)果獲得了具有癌癥治療潛力的新型化合物,證明了 AI 在發(fā)現(xiàn)新型候選藥物的能力[2]。
MEK 也是治療癌癥的潛在靶點(diǎn),但是該靶點(diǎn)的有效抑制劑的開(kāi)發(fā)一直具有挑戰(zhàn)性,Zhu,J 等人在 2021 年報(bào)道了通過(guò)訓(xùn)練 ML (機(jī)器學(xué)習(xí)) 算法,識(shí)別出這種蛋白質(zhì)的新型抑制劑[3]。另一個(gè)例子是通過(guò)使用 ML 算法發(fā)現(xiàn) β-分泌酶 (BACE1) 的新型抑制劑,BACE1 是一種參與阿爾茲海默癥的蛋白[4]。在 COVID-19 大流行期間,AI 的潛力顯得尤為突出,AI 算法被用于分析潛在的大型化合物數(shù)據(jù)集,并確定了最有可能對(duì)抗該病毒的化合物[5][6][7][8][9][10]。
本次 AI 大賽獲得一等獎(jiǎng)的團(tuán)隊(duì)為上科大的 GeminiMol 團(tuán)隊(duì),構(gòu)象空間是他們的一大亮點(diǎn),該模型能夠識(shí)別 2D 結(jié)構(gòu)不相似,但 3D 構(gòu)象相似的潛在活性分子,有助于發(fā)現(xiàn)具有新穎結(jié)構(gòu)的先導(dǎo)化合物。該模型基于分子間構(gòu)象空間相似性對(duì)比學(xué)習(xí)來(lái)進(jìn)行訓(xùn)練,能夠表征藥物小分子的構(gòu)象空間特征,全面反映與分子結(jié)構(gòu)相關(guān)的分子屬性、潛在藥效性質(zhì)等,進(jìn)而在包括基于配體的虛擬篩選、靶標(biāo)鑒定、分子屬性預(yù)測(cè)等多種藥物發(fā)現(xiàn)任務(wù)上表現(xiàn)出均衡的優(yōu)良性能。
近日,該模型相關(guān)論文“Conformational Space Profiling Enhances Generic Molecular Representation for AI-powered Ligand-based Drug Discovery”已發(fā)布于國(guó)際期刊 Advanced Science 雜志。
未來(lái),平臺(tái)將緊跟全球研發(fā)前沿,持續(xù)豐富專(zhuān)業(yè)資源與科研工具,提升視覺(jué)形象與用戶體驗(yàn),鏈接全球產(chǎn)業(yè)鏈資源,推進(jìn)產(chǎn)業(yè)提質(zhì)增效。在系統(tǒng)化、專(zhuān)業(yè)化、精益化的戰(zhàn)略引領(lǐng)下,平臺(tái)致力于打造適合科學(xué)研究領(lǐng)域的一站式藥物發(fā)現(xiàn)及研究服務(wù)平臺(tái),構(gòu)建開(kāi)放、公益的化合物信息共享平臺(tái),為科學(xué)研究提供各種化合物與試劑,為科研工作者和學(xué)術(shù)界提供一個(gè)創(chuàng)新、高效、協(xié)作的平臺(tái),為新藥研發(fā)提供智能化解決方案,更好推動(dòng)科學(xué)發(fā)展和知識(shí)共享。
產(chǎn)品推薦 |
DNA 編碼化合物庫(kù)(DNA Encoded compound Library,DEL)技術(shù)作為新穎、強(qiáng)大的苗頭化合物發(fā)現(xiàn)引擎,可快速?gòu)膸浊f(wàn)至數(shù)十億分子中,遴選出結(jié)構(gòu)新穎、具有潛在成藥性的化合物,大大縮短藥物研究周期,降低研發(fā)成本。在 DEL 庫(kù)中,每一個(gè)分子砌塊(Building Block)都由一段已知唯一的 DNA 序列進(jìn)行標(biāo)記,通過(guò) DNA 兼容反應(yīng)和組合化學(xué)模式,歷經(jīng)數(shù)個(gè)循環(huán)即可獲得上億 DEL 分子。數(shù)十億化合物可以混合在一管中篩選,最終通過(guò)高通量測(cè)序技術(shù),解碼 DEL 分子的專(zhuān)屬 DNA 標(biāo)簽,快速獲得針對(duì)靶點(diǎn)的苗頭化合物信息。 |
50K Diversity Library (HY-L901) 由 50,000 種類(lèi)藥化合物組成。本多樣性庫(kù)具備新穎性、類(lèi)藥性,結(jié)構(gòu)多樣性等特點(diǎn),庫(kù)中化合物可重復(fù)供應(yīng),是新藥研發(fā)的有力工具,可以廣泛地應(yīng)用于高通量篩選 (HTS) 和高內(nèi)涵篩選 (HCS)。 |
5K Scaffold Library(HY-L902) 由 5,000 種類(lèi)藥化合物組成,每種化合物代表一種結(jié)構(gòu)骨架,最大程度保證了庫(kù)的結(jié)構(gòu)多樣性。庫(kù)中的化合物均經(jīng)過(guò) MedChem & PAINS filters 篩選,剔除了不合適的化學(xué)結(jié)構(gòu),避免“目標(biāo)錯(cuò)誤”。本庫(kù)化合物數(shù)量少但結(jié)構(gòu)足夠多樣,是藥物篩選的有力工具。 |
3D Diverse Fragment Library (HY-L903) 由 5,196 個(gè)非平面片段分子組成 (平均 Fsp3 值為 0.58),超過(guò) 4,700 個(gè)片段至少包含一個(gè)手性中心。本庫(kù)設(shè)計(jì)的關(guān)鍵元素是 3D 結(jié)構(gòu)、多樣性、生物反應(yīng)性等,有效提高了片段潛在生物活性,為基于片段的藥物發(fā)現(xiàn)提供了更高的片段命中概率。 |
Drug Fragment Library (HY-L904) MCE Drug Fragment Library 由 1,000 個(gè)藥物片段組成。這些藥物片段來(lái)自 2,946 個(gè) FDA 已批準(zhǔn)的藥物分子,同一藥物的不同片段可以出現(xiàn)在其他藥物中,這些片段和 PK/PD 性質(zhì)存在一定的相關(guān)性,基于片段的篩選可以為后續(xù)優(yōu)化結(jié)構(gòu)預(yù)留出足夠的化學(xué)空間,該化合物庫(kù)是 FBDD(基于片段的藥物設(shè)計(jì))藥物篩選的必備工具。 |
Natural Product-like Library (HY-L905) MCE Natural Product-like Compound Library 由 5,000 個(gè)來(lái)自類(lèi)藥庫(kù)的類(lèi)天然產(chǎn)物化合物組成,庫(kù)中每個(gè)分子含有天然產(chǎn)物關(guān)鍵骨架(42 個(gè))或者和天然產(chǎn)物的谷本相似系數(shù)大于 0.6,且Natural-likeness scoring > -2,該化合物庫(kù)同時(shí)具備類(lèi)藥性和新穎性,庫(kù)中化合物可重復(fù)供應(yīng),是新藥研發(fā)的有力工具,可以廣泛地應(yīng)用于高通量篩選 (HTS) 和高內(nèi)涵篩選 (HCS)。 |