加載中........
×

Cell封面:人類首次完全利用AI發現迄今最強抗生素

2020-2-22 作者:機器之心   來源:機器之心 我要評論0
Tags: 抗生素  

自青霉素出現以來,抗生素已經成為現代醫學的基石。然而,隨著時間的推移,細菌會逐漸產生對抗生素的耐藥性,這就需要藥物研發工作者不斷開發新的抗生素。
但現實情況是,由于缺乏經濟激勵,私營藥企在新抗生素的發現上收效甚微,使得抗生素的問題越發嚴重。曾有研究預測,如果不立即采取措施開發新的抗生素,到 2050 年,因耐藥感染而死亡的人數將達到每年 1000 萬人。
在過去的幾十年里,研發人員使用多種傳統方法挖掘新的抗生素,但很多時候,他們會一次又一次地發現相同的分子,因此新抗生素的發現步履維艱。在此背景下,生物醫學界亟需新的方法來幫助發現新抗生素。
解決 WHO「通緝令」上最危險的病原體
為了解決上述問題,來自 MIT 合成生物學中心的研究者開發了一種可以預測抗生素分子活性的深度學習方法,從超過 1.07 億種分子中識別出了強大的新型抗生素分子——halicin。halicin 可以對抗多種細菌,如肺結核以及被認為無法治療的菌株。而且,這種新發現的分子在結構上與已知的抗生素分子有很大不同。
在小鼠實驗中,該分子對多種病原體具有抗菌活性,包括艱難梭菌(Clostridioides difficile)、腸桿菌科(Enterobacteriaceae)和有「廣泛耐藥性」并迫切需要新抗生素的鮑曼不動桿菌(Acinetobacter baumannii)。其中,后兩者被世界衛生組織(WHO)列為高優先級病原體,是新抗生素三大研究目標中的兩個。


雖然之前已有使用人工智能作用于部分抗生素發現的應用案例,但研究團隊強調,此次最新發現是基于沒有任何先前假設的情況下,完全從零開始識別出的全新抗生素種類
目前,這項研究工作由麻省理工學院(MIT)的合成生物學家 Jim Collins 主導,已發表在權威學術期刊《Cell》上,并成為當期封面文章。


「就抗生素發現而言,這絕對是第一次,」該研究的作者之一、MIT 機器學習專家 Regina Barzilay 表示。
「我們希望能夠開發一個平臺,使人類能夠利用人工智能的力量來開創抗生素藥物發現的新時代。我認為 halicin 是迄今為止,人類發現的最強大抗生素之一,」MIT 團隊生物工程師 James Collins 補充道。「它對于大量抗藥性病原體展示了顯著的活性。」
論文鏈接:https://www.cell.com/cell/fulltext/S0092-8674(20)30102-1


賓夕法尼亞州匹茲堡大學的計算生物學家 Jacob Durrant 表示,此項研究意義非凡,研究團隊不僅確認了候選分子,同時還在動物實驗中驗證了有潛力的分子。更重要的是,這種方法具有一定的泛化性,可以應用于其他類型的藥物研究,例如用于治療癌癥或者是神經退行性的疾病。
發現過程
在尋找新抗生素的過程中,研究者訓練了一個深度神經網絡,以尋找抑制大腸桿菌生長的分子。在訓練過程中,他們用到了 2335 個已知具有抗菌活性的分子,包括大約 300 種已獲批的抗生素和 800 種從植物、動物和微生物中得到的天然產物。
在這項研究中,模型不需要知道關于藥物機理的假設,也不需要化學基團的標注就能執行預測。該模型能夠學習人類專家未知的新模式。
訓練完成后,研究者用該模型在一個名為「Drug Repurposing Hub」的庫中進行分子篩選,里面有大約 6000 種正處于研究階段的對抗人類疾病的藥物分子。
此次篩選的目的是看哪種分子能對抗大腸桿菌,并挑選出那些看起來和常規抗生素不一樣的分子。從這些結果里再選出 100 個候選分子進行物理試驗,
結果,他們發現,一種名為「halicin」的分子效果很好,而這一分子正處于針對糖尿病治療的研究階段。在小鼠實驗中,該分子對多種病原體具有抗菌活性,包括艱難梭菌、腸桿菌科和有「廣泛耐藥性」并迫切需要新抗生素的鮑曼不動桿菌。

論文的圖片摘要。
抗生素分子的圖建模
整體來看,神經網絡起到的作用就是預測不同分子結構最終對大腸桿菌的抑制能力。按照正常思維,我們需要一個數據集,其中輸入特征是分子的組成部分與結構,標注為對大腸桿菌的抑制能力。而神經網絡的優勢在于,它能以一個自己學習的向量來表征分子,而不是手工設計的特征向量。
在這篇論文中,研究者表示有向信息傳遞網絡能直接從分子的圖結構預測分子的屬性,其中原子可以表示為節點,化學鍵可以表示為邊。對于每一個化學分子,研究者針對每一個組成部分的 SMILES 表達式建立分子圖,其中 SMILES 是一種用 ASCII 字符串明確描述分子結構的規范。
在初始化特征向量時,它又分為原子特征向量與化學鍵特征向量。如下最左邊的神經網絡建模,其最上面為一個分子圖,第 3 個原子和第 4 個原子都有連向第 2 個原子的化學鍵(Bond),下面兩個黑色的向量表示這兩個連接。以此類推,紅色向量表示第 2 個原子連接到第 1 個原子的化學鍵。

該模型應用了一系列信息傳遞步驟,它會聚合鄰近原子與化學鍵的信息,從而理解局部分子的化學性質。在有向信息傳遞網絡的每次信息傳遞過程中,通過求和鄰近化學鍵特征向量,并饋送到非線性單層神經網絡中,化學鍵特征向量能得到更新。
經過固定次數的信息傳遞步驟,整個分子學到的各種特征向量會加和為單個向量,并饋送到前饋神經網絡以預測該化學分子對大腸桿菌的抑制效果。后面的 FFN 就是非常常規的二分類問題了,因此整個抗生素分子建模最重要的就是第一步的圖模型:如何用圖與向量表示分子之間的復雜關系。
這項開創性的工作標志著抗生素發現乃至更普遍的新藥研發方法發生了范式轉變。未來,MIT 的研究人員還計劃使用深度學習模型來設計新的抗生素,并優化現有的分子。
其實,抗生素分子的發現只是機器學習在藥物挖掘領域應用的冰山一角,全球各地的學者都在嘗試用機器學習技術加快新藥研發進度。以新型冠狀病毒的新藥研發為例,部分 AI 藥物研發公司已經開始嘗試用多種深度學習模型進行藥物分子的挖掘(如英科智能利用二十多種模型尋找對新冠病毒關鍵蛋白酶有抑制作用的分子),相關成果也在陸續公布。

參考內容:https://www.nature.com/articles/d41586-020-00018-3http://news.mit.edu/2020/artificial-intelligence-identifies-new-antibiotic-0220https://www.theguardian.com/society/2020/feb/20/antibiotic-that-kills-drug-resistant-bacteria-discovered-through-aihttps://insilico.com/ncov-sprint



小提示:78%用戶已下載梅斯醫學APP,更方便閱讀和交流,請掃描二維碼直接下載APP

只有APP中用戶,且經認證才能發表評論!馬上下載

web對話
最好的股票分析软件排行榜