您現在的位置是:首頁 >人工智能 > 2022-07-13 16:54:07 來源:
人工智能模型發現潛在藥物分子的速度要快一千倍
整個已知宇宙都充滿了無數的分子。但是這些分子中有多少具有潛在的類似藥物的特征,可用于開發挽救生命的藥物治療?百萬?數十億?萬億?答案是:novemdecillion,或1060。這個龐大的數字延長了等快速傳播疾病的藥物開發過程,因為它遠遠超出了現有藥物設計模型可以計算的范圍。換個角度來看,銀河系大約有10億顆或108顆恒星。
在將在國際機器學習會議(ICML)上發表的一篇論文中,麻省理工學院的研究人員開發了一種名為EquiBind的幾何深度學習模型,它比現有最快的計算分子對接模型QuickVina2-W快1200倍,成功地將藥物樣分子與蛋白質結合。EquiBind基于其前身EquiDock,該技術專門使用已故的Octavian-EugenGanea、麻省理工學院計算機科學與人工智能實驗室和AbdulLatifJameelClinicforMachineLearninginHealth(JameelClinic)開發的技術結合兩種蛋白質博士后,他也是EquiBind論文的合著者。
在藥物開發開始之前,藥物研究人員必須找到有希望的藥物樣分子,這些分子可以在稱為藥物發現的過程中正確結合或“對接”某些蛋白質靶標。在成功與蛋白質對接后,結合藥物(也稱為配體)可以阻止蛋白質發揮作用。如果這種情況發生在細菌的一種必需蛋白質上,它可以細菌,從而保護人體。
然而,藥物發現的過程在財務和計算上都可能是昂貴的,數十億美元投入到這個過程中,并且在食品和藥物管理局最終批準之前進行了十多年的開發和測試。更重要的是,90%的藥物在人體試驗后由于沒有效果或副作用過多而失敗。制藥公司收回這些失敗成本的方法之一是提高成功藥物的價格。
當前尋找有前景的候選藥物分子的計算過程是這樣的:大多數最先進的計算模型依賴于大量候選樣本以及評分、排名和微調等方法,以獲得最佳的“擬合”。配體和蛋白質。
HannesStärk是麻省理工學院電氣工程和計算機科學系的一年級研究生,也是該論文的主要作者,他將典型的配體與蛋白質結合方法比作“試圖將鑰匙插入有很多鎖孔的鎖中”。”在選擇最佳模型之前,典型模型會花費大量時間對每個“擬合”進行評分。相比之下,EquiBind只需一步即可直接預測精確的關鍵位置,而無需事先了解蛋白質的目標口袋,這被稱為“盲對接”。
案例研究顯示蛋白質酪氨酸激酶6HD6(綠色)和兩種用于肺癌、白血病和胃腸道腫瘤的抑制劑藥物(紅色和藍色)。GLIDE是使用的計算模型之一,它不如EquiBind準確。圖片來源:HannesStärk等人
與大多數需要多次嘗試才能找到配體在蛋白質中的有利位置的模型不同,EquiBind已經具有內置的幾何推理功能,可幫助模型學習分子的基本物理特性并成功泛化以在遇到新的、看不見的數據時做出更好的預測.
這些發現的發布很快引起了行業專業人士的關注,其中包括RelayTherapeutics的首席數據官PatWalters。沃爾特斯建議該團隊在已經存在的用于肺癌、白血病和胃腸道腫瘤的藥物和蛋白質上嘗試他們的模型。盡管大多數傳統的對接方法未能成功地結合對這些蛋白質起作用的配體,但EquiBind成功了。
“EquiBind為對接問題提供了一種獨特的解決方案,它結合了姿勢預測和結合位點識別,”Walters說。“這種方法利用了來自數千個公開可用的晶體結構的信息,有可能以新的方式影響該領域。”
“我們很驚訝,雖然所有其他方法都完全錯誤或只有一個正確,但EquiBind能夠將其放入正確的口袋中,因此我們很高興看到這一結果,”Stärk說。
雖然EquiBind收到了來自行業專業人士的大量反饋,這些反饋幫助團隊考慮了計算模型的實際用途,但Stärk希望在7月即將舉行的ICML上找到不同的觀點。
“我最期待的反饋是關于如何進一步改進模型的建議,”他說。“我想與這些研究人員討論……告訴他們我認為下一步可以做什么,并鼓勵他們繼續前進,將模型用于他們自己的論文和他們自己的方法……我們已經有很多研究人員已經伸出援手,并詢問我們是否認為該模型對他們的問題有用。”
這部作品是為了紀念Octavian-EugenGanea,他為幾何機器學習研究做出了重要貢獻,并慷慨地指導了許多學生——一位有著謙遜靈魂的杰出學者。