DeepMind開源AlphaFold2 學術圈再一次沸騰

發(fā)布時間:2021-08-20 10:02:37  |  來源:量子位  

最近,DeepMind 開源 AlphaFold2,讓學術圈再一次沸騰了。

這意味著,對于普通研究人員而言曾需要花幾年時間才能破解的蛋白質(zhì)結構,現(xiàn)在用 AlphaFold2 幾小時就能算出來了!

那么,如此厲害的 AlphaFold2 究竟如何做到的呢?DeepMind 團隊已經(jīng)將它的詳細信息在《Nature》上公開發(fā)表?,F(xiàn)在,就讓我們來看看 AlphaFold2 的魔法是怎么實現(xiàn)的吧。卷積消失了,Attention 來了

論文中,研究人員強調(diào) AlphaFold2 是一個完全不同于 AlphaFold 的新模型。的確,它們使用的模型框架都不一樣,這也是 AlphaFold2 準確性能夠突飛猛進的主要原因。此前AlphaFold 中所有的卷積神經(jīng)網(wǎng)絡,現(xiàn)在都被替換成了 Attention。

為什么要這樣做呢?我們首先要了解一下 AlphaFold 的工作原理:

它主要是通過預測蛋白質(zhì)中每對氨基酸之間的距離分布,以及連接它們的化學鍵之間的角度,然后將所有氨基酸對的測量結果匯總成 2D 的距離直方圖。

然后讓卷積神經(jīng)網(wǎng)絡對這些圖片進行學習,從而構建出蛋白質(zhì)的 3D 結構。

但這是一種從局部開始進行預測的方式,很有可能會忽略蛋白質(zhì)結構信息的長距離依賴性。

而 Attention 的特點剛好可以彌補這一缺陷,它是一種模仿人類注意力的網(wǎng)絡架構,可以同時聚焦多個細節(jié)部分。

這樣可以使得框架預測的結果更加全面、準確。

在 CASP13 中,AlphaFold 預測的準確性還只有不到 60 分。

但是在 CASP14 中 AlphaFold2 就將準確性直接拔高到了 92.4/100。

圖網(wǎng)絡 + Attention

具體來看,AlphaFold2 主要利用多序列比對(MSA),把蛋白質(zhì)的結構和生物信息整合到了深度學習算法中。

它主要包括兩個部分:神經(jīng)網(wǎng)絡 EvoFormer 和結構模塊(Structure module)。

在 EvoFormer 中,主要是將圖網(wǎng)絡(Graph networks)和多序列比對(MSA)結合完成結構預測。

圖網(wǎng)絡可以很好表示事物之間的相關性,在這里,它可以將蛋白質(zhì)的相關信息構建出一個圖表,以此表示不同氨基酸之間的距離。

研究人員用 Attention 機制構建出一個特殊的“三重自注意力機制(Triangular self-attention)”,來處理計算氨基酸之間的關系圖。

然后,他們將這一步得到的信息與多序列比對結合。

多序列比對主要是使相同殘基的位點位于同一列,暴露出不同序列之間的相似部分,從而推斷出不同蛋白質(zhì)在結構和功能上的相似關系。

計算出的氨基酸關系與 MSA 進行信息交換,能直接推理出空間和進化關系的配對表征。

預測所有原子的 3D 結構

架構的第二部分是一個結構模塊(Structure Module),它的主要工作是將 EvoFormer 得到的信息轉換為蛋白質(zhì)的 3D 結構。

在這里,研究人員同樣使用了 Attention 機制,它可以單獨計算蛋白質(zhì)的各個部分,稱為“不變點注意力(invariant point attention)”機制。

它以某個原子為原點,構建出一個 3D 參考場,根據(jù)預測信息進行旋轉和平移,得到一個結構框架。

然后 Attention 機制會對所有原子都進行預測,最終匯總得出一個高度準確的蛋白質(zhì)結構。

此外,研究人員還強調(diào) AlphaFold2 是一個“端到端”的神經(jīng)網(wǎng)絡。

他們會反復把最終損失應用于輸出結果,然后再對輸出結果進行遞歸,不斷逼近正確結果。

這樣做既能減少額外的訓練,還能大幅提高預測結構的準確性。

為破解蛋白質(zhì)折疊謎題帶來希望

Alphafold2 的出現(xiàn),能更好地預判蛋白質(zhì)與分子結合的概率,從而極大地加速新藥研發(fā)的效率。

此次 Alphafold2 開源,將進一步推動科學界前進。

據(jù)了解,目前 DeepMind 已經(jīng)與瑞士的一些研究團隊合作,通過預測蛋白質(zhì)結構開展藥物方面的研究。

事實上,研究 Alphafold2 預測程序本身,也為探索蛋白質(zhì)結構折疊原理帶來了希望。

芝加哥大學的計算生物學家 Jinbo Xu 就表示:

這些工具的開源,意味著科學界能夠在此基礎上開發(fā)出更加強大的軟件。

關鍵詞: DeepMind 開源 AlphaFold2 學術圈

 

網(wǎng)站介紹  |  版權說明  |  聯(lián)系我們  |  網(wǎng)站地圖 

星際派備案號:京ICP備2022016840號-16 營業(yè)執(zhí)照公示信息版權所有 郵箱聯(lián)系:920 891 263@qq.com