• 您現在的位置是:首頁 >要聞 > 2020-12-09 15:21:30 來源:

    深度學習有助于弄清基因相互作用

    導讀 卡內基梅隆大學計算機科學家采用了一種深度學習方法,近年來徹底改變了人臉識別和其他基于圖像的應用程序,并將其功能重新定向到探索基因之

    卡內基梅隆大學計算機科學家采用了一種深度學習方法,近年來徹底改變了人臉識別和其他基于圖像的應用程序,并將其功能重新定向到探索基因之間的關系。

    他們說,訣竅在于將大量的基因表達數據轉換成更像圖像的東西。善于分析視覺圖像的卷積神經網絡(CNN)隨后可以推斷出哪些基因正在相互作用。CNN在此任務上的表現優于現有方法。

    研究人員關于CNN如何幫助鑒定與疾病相關的基因以及可能成為藥物靶標的發育和遺傳途徑的報告今天在《國家科學院院刊》上發表。但是計算生物學和機器學習教授Ziv Bar-Joseph表示,這種名為CNNC的新方法的應用范圍可能遠遠超出基因相互作用。

    與博士后Ye Yuan共同撰寫論文的Bar-Joseph說,論文中描述的新見解表明,CNNC可以類似地用于調查包括財務數據和社交網絡在內的各種現象的因果關系。CMU機器學習系研究員。

    Bar-Joseph說:“十年前開發的CNN具有革命性意義。” 當他在智能手機上滾動瀏覽照片時,他補充說:“我仍然對使用谷歌照片進行面部識別感到敬畏。”他展示了該應用程序如何識別不同年齡的兒子,或根據圖像識別父親頭部右后方 “我們有時會把這項技術視為理所當然的,因為我們一直在使用它。但是它功能強大,而且不僅限于圖像。這完全取決于您如何表示數據。”

    在這種情況下,他和袁正在研究基因關系。人類中大約有20,000個基因協同工作,因此有必要知道基因如何在復合體或網絡中協同工作以了解人類的發育或疾病。

    推斷這些關系的一種方法是查看基因表達,它表示細胞中基因的活性水平。通常,如果基因A同時激活,則基因B激活,這就是兩者相互作用的線索。不過,這可能是巧合,或者兩者都被第三個基因C激活。已經開發出了幾種先前的方法來弄清這些關系。

    為了利用CNN來幫助分析基因關系,Yuan和Bar-Joseph使用了單細胞表達數據,這些實驗可以確定單個細胞中每個基因的水平。然后,以矩陣或直方圖的形式排列數十萬個這些單細胞分析的結果,以使矩陣的每個細胞代表一對基因的不同共表達水平。

    以這種方式呈現數據增加了空間方面,這使得數據更像圖像,因此CNN更易于訪問。通過使用來自已經建立了相互作用的基因的數據,研究人員能夠訓練CNN識別哪些基因在相互作用,哪些不是基于數據矩陣中的視覺模式。

    Yuan說:“很難區分因果關系和相關性,”但是CNNC方法在統計學上比現有方法更準確。他和Bar-Joseph期望CNNC將成為研究人員最終將用于分析大型數據集的幾種技術之一。

    Bar-Joseph說:“這是一種非常通用的方法,可以應用于許多分析。” 主要限制是數據-數據越多,CNN的工作效果越好。細胞生物學非常適合使用CNNC,因為典型的實驗可能涉及成千上萬個細胞并產生大量數據。

  • 成人app