• 您現在的位置是:首頁 >人工智能 > 2022-04-27 15:50:06 來源:

    人工智能技術縮小到只提出可以在實驗室生產的候選分子

    導讀 制藥公司正在使用人工智能來簡化發現新藥的過程。機器學習模型可以提出具有特定特性的新分子,這些分子可以對抗某些疾病,在幾分鐘內完成人

    制藥公司正在使用人工智能來簡化發現新藥的過程。機器學習模型可以提出具有特定特性的新分子,這些分子可以對抗某些疾病,在幾分鐘內完成人類可能需要幾個月才能手動完成的工作。

    但是有一個主要障礙阻礙了這些系統的發展:這些模型通常會提出在實驗室中難以或不可能生產的新分子結構。如果化學家實際上不能制造這種分子,則無法測試其抗病特性。

    麻省理工學院研究人員的一種新方法限制了機器學習模型,因此它只建議可以合成的分子結構。該方法保證分子由可以購買的材料組成,并且這些材料之間發生的化學反應遵循化學定律。

    與其他方法相比,他們的模型提出的分子結構在流行的評估中得分很高,有時甚至更好,但保證可合成。他們的系統還需要不到一秒鐘的時間來提出合成途徑,而其他單獨提出分子然后評估其可合成性的方法可能需要幾分鐘。在包含數十億潛在分子的搜索空間中,這些時間節省加起來。

    “這個過程重新制定了我們如何要求這些模型生成新的分子結構。其中許多模型考慮的是逐個原子或逐個鍵地構建新的分子結構。相反,我們正在逐個構建新的分子構建塊,并通過反應構建新的分子,”康納·科利(ConnorColey)說,他是麻省理工學院化學工程、電氣工程和計算機科學系的HenriSlezynger職業發展助理教授,也是該論文的高級作者。

    加入Coley的還有第一作者、研究生高文豪和博士后RocíoMercado。這項研究將于本周在國際學習代表大會上發表。

    建筑模塊

    為了創建分子結構,該模型模擬了合成分子的過程,以確保它可以被生產出來。

    該模型給出了一組可行的構建塊,它們是可以購買的化學品,以及可以使用的有效化學反應列表。這些化學反應模板由專家手工制作。通過只允許某些化學物質或特定反應來控制這些輸入,研究人員可以限制新分子的搜索空間有多大。

    該模型使用這些輸入來構建一棵樹,方法是選擇構建塊并通過化學反應將它們連接起來,一次一個,構建最終的分子。在每個步驟中,隨著添加額外的化學物質和反應,分子會變得更加復雜。

    它輸出最終的分子結構以及合成它的化學和反應樹。

    “我們不是直接設計產品分子本身,而是設計一個動作序列來獲得該分子。這使我們能夠保證結構的質量,”高說。

    為了訓練他們的模型,研究人員輸入了完整的分子結構和一組構建塊和化學反應,模型學習創建合成分子的樹。在查看了數十萬個示例后,該模型學會了自己提出這些合成路徑。

    分子優化

    訓練后的模型可用于優化。研究人員定義了他們希望在最終分子中實現的某些特性,給定某些構建塊和化學反應模板,并且該模型提出了可合成的分子結構。

    “令人驚訝的是,您可以使用如此小的模板集實際復制大部分分子。您不需要那么多構建塊來生成大量可用的化學空間供模型搜索,”Mercado說。

    他們通過評估模型重建可合成分子的能力來測試該模型。它能夠復制51%的這些分子,并且只需不到一秒鐘的時間就可以復制每個分子。

    他們的技術比其他一些方法更快,因為模型沒有搜索樹中每個步驟的所有選項。高解釋說,它有一套明確的化學物質和反應可供使用。

    當他們使用他們的模型提出具有特定性質的分子時,他們的方法提出了更高質量的分子結構,這些分子結構比其他方法具有更強的結合親和力。這意味著這些分子將能夠更好地附著在蛋白質上并阻止某種活動,例如阻止病毒復制。

    例如,當提出一種可以與SARS-Cov-2對接的分子時,他們的模型提出了幾種分子結構,這些分子結構可能比現有的抑制劑更能與病毒蛋白結合。然而,正如作者承認的那樣,這些只是計算預測。

    “有很多疾病需要解決,”高說。“我希望我們的方法可以加速這一過程,這樣我們就不必每次都針對疾病目標篩選數十億個分子。相反,我們可以指定我們想要的特性,它可以加速尋找候選藥物的過程。"

    他們的模型還可以改善現有的藥物發現管道。Mercado說,如果一家公司已經確定了一種具有所需特性但無法生產的特定分子,他們可以使用該模型來提出與其非常相似的可合成分子。

    現在他們已經驗證了他們的方法,該團隊計劃繼續改進化學反應模板,以進一步提高模型的性能。借助額外的模板,他們可以對某些疾病目標進行更多測試,并最終將模型應用于藥物發現過程。

    “理想情況下,我們需要能夠自動設計分子并同時快速為我們提供合成樹的算法,”微軟劍橋研究院(英國)領導一個致力于藥物發現機器學習的團隊的MarwinSegler說。參與了這項工作。“Coley教授和團隊的這種優雅方法是解決這個問題的重要一步。雖然早期有通過合成樹生成進行分子設計的概念驗證工作,但這個團隊確實做到了。這是第一次,他們在有意義的規模上展示了出色的性能,因此它可以對計算機輔助分子發現產生實際影響。

    這項工作也非常令人興奮,因為它最終可以為計算機輔助合成規劃提供新的范式。這可能會對該領域的未來研究產生巨大的啟發。”

  • 成人app