▎藥明康德內(nèi)容團(tuán)隊(duì)編輯
在人工智能迅猛發(fā)展的今天,AI算法已經(jīng)能夠通過人類語言的描述,按要求畫出逼真的圖像。比如,被稱為DALL-E2的AI軟件能夠根據(jù)“泰迪熊在水下使用90年代的技術(shù)進(jìn)行AI研究”這句話,自己生成了下面這張圖片。
▲這不是照片,而是AI軟件根據(jù)人類語言的描述生成的圖片(圖片來源:DALL-E, Public domain, via Wikimedia Commons)
【資料圖】
那這種技術(shù)能夠用來開發(fā)創(chuàng)新藥物么?比如,如果告訴AI軟件我想生成抑制PD-1功能的蛋白療法,它能夠精確產(chǎn)生候選療法的結(jié)構(gòu)么?現(xiàn)在,這種想法已經(jīng)不是只存在于科幻領(lǐng)域的想象。日前,初創(chuàng)公司Generate Biomedicines公司和華盛頓大學(xué)David Baker教授的課題組同日發(fā)布了各自的研究,借助DALL-E2軟件基于的擴(kuò)散模型(diffusion models)算法,開發(fā)的AI平臺可以按照研究人員的要求精準(zhǔn)生成自然界中沒有的全新蛋白結(jié)構(gòu)。Generate Biomedicines公司稱其AI平臺為“生物學(xué)領(lǐng)域的DALL-E2”,為了顯示它能夠按照研究人員的要求生成蛋白結(jié)構(gòu)的能力,該公司的團(tuán)隊(duì)讓這一名為Chroma的平臺生成了模擬26個(gè)英文字母和10個(gè)阿拉伯?dāng)?shù)字形態(tài)的全新蛋白結(jié)構(gòu)。
▲Generate Biomedicines公司的Chroma平臺能夠根據(jù)對蛋白形狀的要求設(shè)計(jì)出全新蛋白結(jié)構(gòu)(圖片來源:Generate Biomedicines公司官網(wǎng))
利用AI進(jìn)行蛋白設(shè)計(jì)今年已經(jīng)獲得多項(xiàng)突破,David Baker教授的課題組今年3月再《自然》發(fā)表重磅論文,介紹了能夠基于靶點(diǎn)蛋白結(jié)構(gòu),設(shè)計(jì)與之緊密結(jié)合的候選蛋白藥物的新技術(shù)。今年9月,該團(tuán)隊(duì)又在《科學(xué)》雜志連發(fā)兩篇論文,利用名為ProteinMPNN的全新深度學(xué)習(xí)工具,從頭設(shè)計(jì)出全新功能性蛋白分子,并且將設(shè)計(jì)蛋白的時(shí)間從“月”縮短至“秒”。不過,此前的蛋白設(shè)計(jì)策略仍然可能需要對成千上萬的候選分子進(jìn)行檢測,才能發(fā)現(xiàn)最終符合預(yù)先要求的分子。
在發(fā)布的最新研究中,兩個(gè)團(tuán)隊(duì)利用了擴(kuò)散模型算法,這種算法是一種神經(jīng)網(wǎng)絡(luò),它通過訓(xùn)練可以清除輸入數(shù)據(jù)中的噪音。如果輸入的數(shù)據(jù)是隨機(jī)的一團(tuán)像素,擴(kuò)散模型能夠?qū)⑺D(zhuǎn)變成為人眼能夠識別的圖像。將它應(yīng)用于蛋白設(shè)計(jì)上,研究人員可以根據(jù)靶點(diǎn)的結(jié)構(gòu),讓AI算法把原先無序和混亂的氨基酸殘基,通過不斷地除噪運(yùn)算,最終拼接成能夠和靶點(diǎn)結(jié)合的候選蛋白。
▲David Baker課題組開發(fā)的AI平臺(名為RF diffusion)可以生成與靶點(diǎn)結(jié)合的創(chuàng)新蛋白(圖片來源:參考資料[2])
David Baker的團(tuán)隊(duì)指出,與此前的蛋白設(shè)計(jì)程序相比,RF diffusion在解決不同設(shè)計(jì)挑戰(zhàn)方面的表現(xiàn)都更為優(yōu)越。它能夠設(shè)計(jì)更為大型和復(fù)雜的蛋白,以及可以相互結(jié)合形成多聚體的蛋白單體。
▲這一平臺可以設(shè)計(jì)出形成多聚體的蛋白,與由多個(gè)亞基組成的靶點(diǎn)蛋白結(jié)合(圖片來源:參考資料[2])
?
尤為重要的一點(diǎn)是,在蛋白設(shè)計(jì)過程中,研究人員可以對蛋白的特性提出各種不同的要求,而AI模型會(huì)根據(jù)這些要求設(shè)計(jì)出相應(yīng)的結(jié)構(gòu)。這讓計(jì)算機(jī)完成的設(shè)計(jì)過程能夠產(chǎn)出最符合設(shè)計(jì)要求的蛋白結(jié)構(gòu),提高“一步到位”的可能性。Baker團(tuán)隊(duì)的文章指出,在有些蛋白設(shè)計(jì)項(xiàng)目中,研究人員發(fā)現(xiàn)只需要在實(shí)驗(yàn)室中檢驗(yàn)計(jì)算機(jī)設(shè)計(jì)一個(gè)候選蛋白,就發(fā)現(xiàn)了符合所有設(shè)計(jì)標(biāo)準(zhǔn)的蛋白。團(tuán)隊(duì)已經(jīng)設(shè)計(jì)出能夠與PD-L1、IL-7Rα、胰島素受體、TrkA受體、和血凝素結(jié)合的蛋白結(jié)構(gòu)。該團(tuán)隊(duì)設(shè)計(jì)的與甲狀旁腺激素結(jié)合的蛋白親和力達(dá)到納摩爾以下。
Generate Biomedicines公司聯(lián)合創(chuàng)始人兼首席科技官Gevorg Grigoryan博士表示,這一技術(shù)好比學(xué)會(huì)了如何使用蛋白的語言進(jìn)行書寫,它將給新藥開發(fā)帶來革命性的影響。“這意味著我們不再依賴大自然進(jìn)化的產(chǎn)物發(fā)現(xiàn)非最佳選擇,而是可以根據(jù)指定的需求,創(chuàng)造和生成高度有效的藥物。”他說。
關(guān)鍵詞: 一鍵生成全新蛋白療法AI蛋白設(shè)計(jì)再獲突破 人工智能