新藥分子發(fā)現(xiàn)提速1200倍!MIT的最新AI模型是如何做到的?

以下文章來源于:藥明康德

在介紹今天的主角之前,想先問大家一個(gè)問題:宇宙中存在著數(shù)不清的分子,其中有多少具有潛在的類藥物特征,可用于藥物開發(fā)?


答案是:10^60,與之相比,銀河系中存在的恒星數(shù)量只有10^11顆。

如此龐大的潛在藥物分子數(shù)量使得研究人員們?cè)陂_發(fā)新藥分子時(shí)需要更長(zhǎng)的時(shí)間,因?yàn)樗h(yuǎn)遠(yuǎn)超出了現(xiàn)有藥物設(shè)計(jì)模型所能計(jì)算的范圍,這也一直是新藥研發(fā)中的痛點(diǎn)之一。那么,是否有方法可以改善這個(gè)現(xiàn)狀呢?

還真有!近期,在一篇即將發(fā)表在國(guó)際機(jī)器學(xué)習(xí)會(huì)議(ICML)雜志上的論文中提到,MIT的研究人員開發(fā)了一種被稱為“EquiBind”的幾何深度學(xué)習(xí)模型,可以極大程度提升發(fā)現(xiàn)潛在新藥分子的速度,從而降低藥物試驗(yàn)失敗的概率,并減少新藥研發(fā)的成本。

微信圖片_20220718170720.png


下面我們來看看EquiBind具體是如何做到的。

在藥物開發(fā)的最早期,研究人員首先要做的是針對(duì)目標(biāo)蛋白找到那些能夠恰當(dāng)?shù)嘏c其靶點(diǎn)區(qū)域結(jié)合或“對(duì)接”的潛在配體,這些配體可以通過阻止蛋白質(zhì)發(fā)揮功能而實(shí)現(xiàn)藥用作用。

目前,找到這些候選類藥分子的計(jì)算過程是這樣的:最先進(jìn)的計(jì)算模型依賴于大量候選采樣、結(jié)合評(píng)分、排序和微調(diào)等方法來找到配體和蛋白質(zhì)之間的最佳“匹配模式”。以一個(gè)形象的例子來說明,典型的配體與蛋白質(zhì)結(jié)合的方法就像“將一把鑰匙插入有許多鑰匙孔的鎖”,現(xiàn)有的典型計(jì)算模型需要將鑰匙插入每一個(gè)鎖孔并對(duì)其匹配度逐一進(jìn)行評(píng)分和排序,從而才能選出最佳模型,這將花費(fèi)大量的時(shí)間。

微信圖片_20220718170723.png

▲EquiBind想要解決的問題(圖片來源:參考資料[2])


而EquiBind內(nèi)置了能夠幫助模型學(xué)習(xí)分子的基本物理信息的幾何推理算法,在遇到此前沒有見過的新數(shù)據(jù)時(shí)能夠成功地進(jìn)行歸納,作出更好的預(yù)測(cè)。也就是說,EquiBind無需事先了解鎖有哪些鎖孔,在一個(gè)步驟中就可以直接預(yù)測(cè)到精確的鎖孔位置,這被稱為”盲對(duì)接”。正是這種方法使EquiBind在成功將配體與蛋白質(zhì)結(jié)合方面比現(xiàn)存最快的計(jì)算分子對(duì)接模型“QuickVina2-W”還要快1200倍。

那么EquiBind在實(shí)際應(yīng)用中的效果是否如研究者所描述的那般神奇呢?Relay Therapeutics的首席數(shù)據(jù)官Pat Walters先生對(duì)EquiBind產(chǎn)生了極大的興趣,并建議其團(tuán)隊(duì)用這一模型模擬一種已經(jīng)用于治療肺癌、白血病和胃腸道腫瘤的藥物與靶點(diǎn)蛋白的結(jié)合。結(jié)果是,當(dāng)大多數(shù)傳統(tǒng)的對(duì)接算法沒有成功預(yù)測(cè)出這一配體/蛋白的相互結(jié)合時(shí),EquiBind卻做到了。

Walters先生表示:“EquiBind為對(duì)接問題(包括姿勢(shì)預(yù)測(cè)和結(jié)合位點(diǎn)識(shí)別提供了一種獨(dú)特的解決方案。這種借助數(shù)千種公開可用的晶體結(jié)構(gòu)信息的方法將通過全新的方式在計(jì)算分子對(duì)接模型領(lǐng)域開拓自己的一片天地。”

該論文主要作者麻省理工學(xué)院電氣工程和計(jì)算機(jī)科學(xué)系的研究生Hannes St?rk先生也表示,已從行業(yè)專業(yè)人士中收到了大量對(duì)EquiBind的反饋,將繼續(xù)改進(jìn)模型,更好地發(fā)揮該計(jì)算模型的實(shí)際應(yīng)用。


參考資料:

[1] Artificial intelligence model finds potential drug molecules a thousand times faster. Retrieved July 12, 2022,from https://news.mit.edu/2022/ai-model-finds-potentially-life-saving-drug-molecules-thousand-times-faster-0712

[2] St?rk et al., (2022). EquiBind: Geometric Deep Learning for Drug Binding Structure Prediction. arXiv, https://doi.org/10.48550/arXiv.2202.05146