您現在的位置是:首頁 >要聞 > 2020-12-09 15:21:34 來源:
這個檸檬可以幫助機器學習創造更好的藥物
使用機器學習進行藥物開發的挑戰之一是為計算機創建一個過程,以從一組數據點中提取所需的信息。藥物科學家必須提取生物學數據并訓練軟件,以了解典型的人體將如何與結合在一起的藥物相互作用而形成藥物。
普渡大學的藥物發現研究人員創建了一個新的框架,用于挖掘用于訓練機器學習模型的數據。這個名為檸檬的框架可幫助藥物研究人員更好地挖掘蛋白質數據庫(PDB),該數據庫是一種綜合資源,具有超過140,000個生物分子結構,并且每周都會發布新的結構。這項工作發表在10月15日的生物信息學上。
普渡大學理學院分析和物理化學助理教授高拉夫·喬普拉(Gaurav Chopra)說:“ PDB是藥物發現界必不可少的工具。“問題在于,整理所有累積的數據可能要花費大量時間。機器學習可以提供幫助,但是您仍然需要一個強大的框架,計算機可以從中快速分析數據以幫助創建安全有效的框架。。”
Lemon軟件平臺是帶有Python綁定的快速C ++ 11庫,可在數分鐘內挖掘PDB。在PDB中加載所有傳統的mmCIF文件大約需要290分鐘,但是,在8核計算機上應用簡單的工作流程時,Lemon大約需要6分鐘。Lemon允許用戶編寫自定義功能,將其包括在其軟件套件中,并以標準方式開發自定義功能,從而為整個科學界生成獨特的基準測試數據集。
“在PDB中存放的實驗結構為結構和計算生物學的科學和教育界帶來了許多進步,有助于推動藥物開發和其他領域的發展,” Jonathan Fine博士說。與Chopra合作開發平臺的化學專業學生。“我們創建了Lemon作為一站式商店,可以快速挖掘整個數據庫并提取對開發藥物至關重要的有用的生物學信息。”
Lemon之所以得名,是因為它最初旨在為藥物設計軟件創建基準測試集,并在PDB中識別檸檬,無法很好建模的生物分子相互作用。