《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 可編程邏輯 > 解決方案 > 速度提高100萬倍,哈佛醫(yī)學(xué)院大神提出可預(yù)測蛋白質(zhì)結(jié)構(gòu)的新型深度模型

速度提高100萬倍,哈佛醫(yī)學(xué)院大神提出可預(yù)測蛋白質(zhì)結(jié)構(gòu)的新型深度模型

2019-04-21

蛋白質(zhì)結(jié)構(gòu)預(yù)測是生命科學(xué)領(lǐng)域的一大難題。近日,來自哈佛大學(xué)醫(yī)學(xué)院的研究人員提出了一種基于氨基酸序列預(yù)測蛋白質(zhì)結(jié)構(gòu)的新方法,準(zhǔn)確率可媲美當(dāng)前最佳方案,但預(yù)測速度提升了100萬倍。

微信圖片_20190421161859.jpg


生命所必需的每一次基礎(chǔ)生物學(xué)進(jìn)展幾乎都是由蛋白質(zhì)帶來的。蛋白質(zhì)參與創(chuàng)建細(xì)胞和組織并保持著它們的形狀;構(gòu)成維持生命所需化學(xué)反應(yīng)的催化酶;充當(dāng)分子工廠、轉(zhuǎn)運(yùn)工具和馬達(dá);充當(dāng)細(xì)胞通訊的信號和接收器等等。


蛋白質(zhì)由很多氨基酸長鏈組成,通過折疊成精確的 3D 結(jié)構(gòu)來完成無數(shù)的任務(wù),這些結(jié)構(gòu)控制著它們與其它分子互動的方式。蛋白質(zhì)的形狀決定了其功能以及它在疾病中的功能紊亂程度。闡明蛋白質(zhì)的結(jié)構(gòu)是所有分子生物學(xué)的核心,更是治療患者、拯救生命、改變生活的醫(yī)學(xué)發(fā)展的核心。


近年來,根據(jù)氨基酸序列預(yù)測蛋白質(zhì)折疊結(jié)構(gòu)方面的計(jì)算方法已經(jīng)取得了很大進(jìn)展。如果能夠充分實(shí)現(xiàn),這些方法可能會改變生物醫(yī)學(xué)研究的方方面面。然而,現(xiàn)在的方法在可測定的蛋白質(zhì)的大小和范圍上是有限的。


最近,哈佛大學(xué)醫(yī)學(xué)院 Blavatnik 研究所系統(tǒng)生物學(xué)家 Mohammed AlQuraishi 發(fā)布了一項(xiàng)新的研究,他根據(jù)氨基酸序列,利用深度學(xué)習(xí)實(shí)現(xiàn)了任意蛋白質(zhì) 3D 結(jié)構(gòu)的高效預(yù)測。在 4 月 17 日的 Cell Systems 期刊中,Mohammed AlQuraishi 詳細(xì)介紹了這種通過計(jì)算確定蛋白質(zhì)結(jié)構(gòu)的新方法,利用該方法實(shí)現(xiàn)的準(zhǔn)確率可媲美當(dāng)前最佳方案,但速度提高了 100 萬倍。


論文:End-to-end differentiable learning of protein structure

論文地址:https://www.biorxiv.org/content/biorxiv/early/2018/08/29/265231.full.pdf

項(xiàng)目地址:https://github.com/aqlaboratory/rgn

微信圖片_20190421161947.jpg

原論文表 2:蛋白質(zhì)結(jié)構(gòu)預(yù)測方法的訓(xùn)練和預(yù)測速度對比。


如上所示,AlQuraishi 提出的循環(huán)幾何網(wǎng)絡(luò)在預(yù)測速度上快了 6 到 7 個(gè)數(shù)量級。其中上表第一行是目前已經(jīng)建立起來的復(fù)雜方法,這些方法嚴(yán)重依賴于模擬和采樣。第二行對應(yīng)于協(xié)同演化(co-evolution)的方法,它也會有一個(gè)學(xué)習(xí)過程。最后一行就是作者提出的一種端到端的可微分方法。


「蛋白質(zhì)折疊是近半個(gè)世紀(jì)以來生物化學(xué)家研究的重要問題之一,此次提出的方法為解決這一問題提供了全新的思路,」AlQuraishi 說道。「現(xiàn)在我們有了一個(gè)探索蛋白質(zhì)折疊的全新方法,我覺得我們現(xiàn)在的研究不過是冰山一角。」

AlQuraishi 研究的特點(diǎn)在于,一名埋頭在哈佛醫(yī)學(xué)院和波士頓生物醫(yī)學(xué)社區(qū)豐富研究生態(tài)系統(tǒng)中的研究人員,居然能夠在計(jì)算機(jī)科學(xué)最熱門的領(lǐng)域里抗衡谷歌等巨頭。——Peter Sorger

說起來簡單


雖然成功率高,但利用物理工具來鑒別蛋白質(zhì)結(jié)構(gòu)的過程既昂貴又耗時(shí),即使是使用現(xiàn)代技術(shù)(如低溫電子顯微鏡)同樣如此。因此,絕大多數(shù)蛋白質(zhì)結(jié)構(gòu)以及致病突變對這些結(jié)構(gòu)的影響目前仍是未知的。


蛋白質(zhì)折疊方式的計(jì)算方法有可能大大降低確定蛋白質(zhì)結(jié)構(gòu)的成本和時(shí)間。但經(jīng)過近四十年的不懈努力,這個(gè)難題仍未解決。

微信圖片_20190421162037.gif

可視化模擬 AlQuraishi 的蛋白質(zhì)折疊深度學(xué)習(xí)方法。模型通過反復(fù)預(yù)測某個(gè)結(jié)構(gòu)(彩色)并將其預(yù)測與真實(shí)結(jié)構(gòu)(灰色)對比來實(shí)現(xiàn)自訓(xùn)練。對數(shù)千種已知蛋白質(zhì)重復(fù)此步驟,模型在每次迭代中都會學(xué)習(xí)并提高自己的準(zhǔn)確率。


蛋白質(zhì)由 20 種不同的氨基酸組成。這些氨基酸就像字母表中的字母,組合成單詞、句子、段落,產(chǎn)生了無數(shù)種可能的文本。然而,與字母不同,氨基酸是位于 3D 空間的物理存在。通常,蛋白質(zhì)的各個(gè)部分在物理上非常接近,但在序列上卻相隔很遠(yuǎn),因?yàn)槠浒被徭溞纬闪谁h(huán)、螺旋、折疊等不同形狀。


AlQuraishi 表示,「這個(gè)問題引人注目的地方在于它說起來簡單:挑一個(gè)序列,想辦法弄清楚它的形狀就可以了。蛋白質(zhì)從一個(gè)非結(jié)構(gòu)化的線開始,必須呈現(xiàn) 3D 形狀,線可能折疊成的形狀有很多種。許多蛋白質(zhì)有上千個(gè)氨基酸長,其復(fù)雜性遠(yuǎn)遠(yuǎn)超過人類直覺甚至強(qiáng)大的計(jì)算機(jī)。」


做起來難


為了應(yīng)對這一挑戰(zhàn),科學(xué)家利用氨基酸的特點(diǎn),即它會在物理法則的約束下相互作用,從而尋找更具潛力的狀態(tài)。目前最先進(jìn)的算法通過超級計(jì)算機(jī)或眾包計(jì)算來尋找蛋白質(zhì)結(jié)構(gòu),它們基本上都是在模擬極其復(fù)雜的氨基酸物理相互作用。為了降低這些方法對大規(guī)模計(jì)算的需求,它們依賴于將新序列映射到預(yù)定義的模板,且這些蛋白質(zhì)結(jié)構(gòu)模板都是之前通過實(shí)驗(yàn)確定的。


其它如 DeepMind 的 AlphaFold 則采用了另一種方法,它利用深度學(xué)習(xí)進(jìn)一步預(yù)測蛋白質(zhì)結(jié)構(gòu)。這類方法會分析大量的基因數(shù)據(jù),其內(nèi)在包含了蛋白質(zhì)的設(shè)計(jì)藍(lán)圖,目前受到了極大的關(guān)注。


AlphaFold 是之前非常受關(guān)注的一項(xiàng)研究,它利用神經(jīng)網(wǎng)絡(luò)來預(yù)測氨基酸對之間的距離,以及連接它們的化學(xué)鍵之間的角度。AlphaFold 參加了 CASP 競賽,它首次參賽就在 98 名參賽者中名列榜首,準(zhǔn)確地從 43 種蛋白質(zhì)中預(yù)測出了 25 種蛋白質(zhì)的結(jié)構(gòu),而同組比賽中獲得第二名的參賽者僅準(zhǔn)確預(yù)測出了 3 種。


然而,這些 AI 方法并不能僅基于蛋白質(zhì)的氨基酸序列預(yù)測結(jié)構(gòu)。這一點(diǎn)會限制 AlphaFold 等方法的能力,因?yàn)樵跊]有先驗(yàn)知識的情況下它們很難決定蛋白質(zhì)結(jié)構(gòu),其在演化獨(dú)特的蛋白質(zhì)或手工設(shè)計(jì)新蛋白質(zhì)上能力有限。


針對這些問題,AlQuraishi 主要從四個(gè)核心概念出發(fā)構(gòu)建新的解決方案。首先我們應(yīng)該要使用循環(huán)神經(jīng)網(wǎng)絡(luò)編碼蛋白質(zhì)序列;其次通過扭轉(zhuǎn)角度參數(shù)化局部蛋白質(zhì)的結(jié)構(gòu),從而允許模型在不破壞共價(jià)化學(xué)性質(zhì)的情況下對各種結(jié)構(gòu)進(jìn)行推理;再者,我們還應(yīng)該通過循環(huán)幾何單元耦合局部蛋白質(zhì)結(jié)構(gòu)和它的全局表征;最后,使用一種可微損失函數(shù)來捕捉預(yù)測結(jié)構(gòu)與實(shí)際結(jié)構(gòu)之間的差別。


端到端的可微分學(xué)習(xí)


為了開發(fā)新的方法,AlQuraishi 應(yīng)用了一種名為端到端的可微分深度學(xué)習(xí)方法。本質(zhì)上而言,可微分學(xué)習(xí)涉及到一種單獨(dú)的強(qiáng)力數(shù)學(xué)函數(shù):神經(jīng)網(wǎng)絡(luò),通過神經(jīng)元的前饋傳播與反向傳播,可微分學(xué)習(xí)能逐漸學(xué)習(xí)到各種「專業(yè)知識」。


神經(jīng)網(wǎng)絡(luò)這種函數(shù)能在極其復(fù)雜的特征空間上調(diào)整自身,以便精確地學(xué)習(xí)蛋白質(zhì)序列與其結(jié)構(gòu)之間的數(shù)學(xué)關(guān)系。AlQuraishi 就構(gòu)建了一種名為循環(huán)幾何網(wǎng)絡(luò)(Recurrent Geometric Network)的深度學(xué)習(xí)模型,它側(cè)重建模蛋白質(zhì)折疊的關(guān)鍵特征。


循環(huán)幾何網(wǎng)絡(luò)


模型輸入一個(gè)氨基酸序列和 PSSM(具體位置的評分矩陣)并輸出一個(gè) 3D 結(jié)構(gòu)。它由三個(gè)階段組成:計(jì)算、幾何建模和評估——因此將其稱為循環(huán)幾何網(wǎng)絡(luò)(RGN)。


第一階段由計(jì)算單元組成,對于每個(gè)殘基位置(residue position),計(jì)算單元將關(guān)于氨基酸和 PSSM 的信息與來自相鄰單元的信息整合。通過將這些單元放在循環(huán)雙向拓?fù)浣Y(jié)構(gòu)中(圖 2),對每個(gè)殘基的計(jì)算整合了從殘基上游和下游一直到 N-和 C-端的信息,覆蓋了整個(gè)蛋白質(zhì)。

微信圖片_20190421162230.jpg

原論文圖 2:循環(huán)幾何網(wǎng)絡(luò)主要過程。


第二階段由幾何單元組成,該幾何單元輸入給定殘基的扭轉(zhuǎn)角和由其上游的幾何單元產(chǎn)生的部分完成的骨干,并輸出由一個(gè)殘基延伸的新骨干,該骨干被輸入至相鄰的下游單元。最后的單元輸出蛋白質(zhì)的完整 3D 結(jié)構(gòu)。


在模型訓(xùn)練期間,第三階段使用基于距離的均方根誤差(dRMSD)度量來計(jì)算預(yù)測結(jié)構(gòu)和實(shí)驗(yàn)結(jié)構(gòu)之間的誤差。dRMSD 首先計(jì)算預(yù)測結(jié)構(gòu)中所有原子和實(shí)驗(yàn)結(jié)構(gòu)中所有原子的成對距離(分別計(jì)算),然后計(jì)算這些距離集合之間的均方根。

微信圖片_20190421163610.gif


如上展示了循環(huán)幾何網(wǎng)絡(luò)模型如何計(jì)算氨基酸之間鍵的角度以及這些鍵周圍的旋轉(zhuǎn)角,獲取這兩個(gè)信息就可以采集蛋白質(zhì)結(jié)構(gòu)的幾何形狀。動畫:Mohammed AlQuraishi。


對于每個(gè)氨基酸,模型預(yù)測連接其與相鄰氨基酸的化學(xué)鍵最可能的角度。它還預(yù)測這些鍵周圍的旋轉(zhuǎn)角,這影響了蛋白質(zhì)的任何局部在幾何上與整個(gè)結(jié)構(gòu)的關(guān)系。


這個(gè)過程會重復(fù)進(jìn)行,每次計(jì)算都需要使用和提煉所有其它氨基酸的相對位置信息。一旦整個(gè)結(jié)構(gòu)完成,模型會將預(yù)測結(jié)果與蛋白質(zhì)的「標(biāo)注真值」結(jié)構(gòu)進(jìn)行比較,以檢查其預(yù)測準(zhǔn)確率。


這整個(gè)過程在成千上萬種已知的蛋白質(zhì)中重復(fù)進(jìn)行,模型在每次迭代中學(xué)習(xí)并提升其準(zhǔn)確率。


新的前景


一旦其模型訓(xùn)練好,AlQuraishi 會測試它的預(yù)測能力,它們將該模型與近年來蛋白質(zhì)結(jié)構(gòu)預(yù)測關(guān)鍵評估(CASP)的其它方法進(jìn)行了比較。CASP 是一個(gè)年度實(shí)驗(yàn),它通過已經(jīng)確定但未公開的蛋白質(zhì)結(jié)構(gòu)測試各種預(yù)測方法的能力。


他發(fā)現(xiàn)在沒有預(yù)先設(shè)計(jì)的模板時(shí),新模型在預(yù)測蛋白質(zhì)結(jié)構(gòu)方面遠(yuǎn)遠(yuǎn)優(yōu)于其它方法,包括使用協(xié)同演化數(shù)據(jù)的方法。當(dāng)預(yù)定義模板可用于預(yù)測時(shí),新模型還是優(yōu)于最佳方法之外的其它方法。


雖然提升并不大,但這種方法表示了一類新的蛋白質(zhì)折疊預(yù)測方法,它與現(xiàn)有的方法是互補(bǔ)的關(guān)系。值得注意的是,新模型的預(yù)測速度比現(xiàn)有計(jì)算方法快 6 到 7 個(gè)數(shù)量級。訓(xùn)練模型可能需要數(shù)月,但一旦訓(xùn)練完成,預(yù)測新蛋白質(zhì)結(jié)構(gòu)可以在幾毫秒內(nèi)完成。這種加速在于深度網(wǎng)絡(luò)是一種獨(dú)立的數(shù)學(xué)函數(shù),它只需要幾千行代碼而不是數(shù)百萬行代碼就能完成。


這種極速使得蛋白質(zhì)預(yù)測變得更加簡單,以前無法想象的應(yīng)用也都會慢慢冒出來。AlQuraishi 表示:「新模型還沒有立即用于新藥開發(fā)或設(shè)計(jì),因?yàn)樗臏?zhǔn)確度大約在 6 埃(一億分之一厘米)左右,與解決蛋白質(zhì)原子結(jié)構(gòu)所需的 1 到 2 埃還有一定距離。」


但是在深度學(xué)習(xí)快速發(fā)展的今天,這種方法將越來越強(qiáng)大,例如如何進(jìn)一步整合化學(xué)和物理知識就值得我們認(rèn)真探討。也許以后的新藥開發(fā)成本會越來越低,醫(yī)療費(fèi)用也會越來越低。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
久久精品99无色码中文字幕 | 亚洲精品视频在线| 亚洲在线电影| 艳女tv在线观看国产一区| 在线看片第一页欧美| 国产综合香蕉五月婷在线| 国产欧美视频一区二区| 国产精品久久久久久久浪潮网站 | 国产精品va在线| 欧美日韩一区视频| 欧美日韩国产综合新一区| 欧美精品一区二区三区久久久竹菊| 牛牛精品成人免费视频| 欧美a级大片| 欧美不卡视频一区| 欧美华人在线视频| 欧美精品在欧美一区二区少妇| 欧美成人乱码一区二区三区| 欧美v国产在线一区二区三区| 久热re这里精品视频在线6| 久久免费视频一区| 久久综合久久综合久久综合| 麻豆av福利av久久av| 欧美成ee人免费视频| 欧美黄色片免费观看| 欧美日本不卡高清| 欧美午夜理伦三级在线观看| 欧美日韩在线播| 国产精品美女视频网站| 国产人妖伪娘一区91| 国内一区二区三区在线视频| 在线看无码的免费网站| 亚洲人成网站999久久久综合| 亚洲日本中文字幕区| 99re6热只有精品免费观看| 亚洲视频专区在线| 欧美在线视频导航| 亚洲国产另类久久精品| 亚洲精品视频一区二区三区| 一本色道久久综合精品竹菊 | 亚洲视频在线观看视频| 欧美在线播放| 久久综合激情| 欧美日韩精品系列| 国产精品综合久久久| 韩国一区二区在线观看| 亚洲国产精品成人va在线观看| 日韩亚洲欧美综合| 欧美亚洲午夜视频在线观看| 亚洲高清视频在线| 一区二区三区国产精华| 欧美一级二级三级蜜桃| 快she精品国产999| 欧美日韩在线播| 国产一区二区成人| 最新高清无码专区| 亚洲一区二区视频| 久久国产主播| 一本色道久久综合亚洲精品按摩| 午夜精彩视频在线观看不卡| 裸体歌舞表演一区二区| 欧美三级视频在线播放| 国产欧美日韩另类视频免费观看| 亚洲国产美女| 亚洲欧美激情精品一区二区| 亚洲国产精品视频一区| 亚洲午夜日本在线观看| 久久久久久久久久久久久女国产乱 | 欧美日产国产成人免费图片| 国产日韩欧美综合| 亚洲美女精品一区| 亚洲高清二区| 午夜精品区一区二区三| 欧美激情亚洲国产| 国产亚洲欧美激情| 99riav久久精品riav| 欧美综合国产精品久久丁香| 国产精品99久久久久久白浆小说 | 一区二区三区精品国产| 91久久夜色精品国产网站| 性色av一区二区三区| 欧美精品在线视频| 韩国三级在线一区| 亚洲欧美在线一区二区| 夜夜狂射影院欧美极品| 久久综合九色综合欧美狠狠| 国产精品黄页免费高清在线观看| 亚洲国产精品成人精品| 亚洲欧美自拍偷拍| 在线视频日韩| 欧美高清在线观看| 激情成人av在线| 亚洲字幕一区二区| 亚洲欧美成人在线| 欧美日韩日本视频| 亚洲国产精品女人久久久| 久久爱www.| 久久精品国产免费看久久精品| 国产精品v欧美精品v日本精品动漫 | 国产区二精品视| 亚洲一区二区视频在线| av不卡在线观看| 欧美国产精品一区| 有码中文亚洲精品| 久久成年人视频| 欧美制服丝袜第一页| 国产精品一区二区在线观看网站 | 在线观看日韩国产| 久久精品国产91精品亚洲| 久久电影一区| 国产精品久久久久久久久久妞妞| 夜夜嗨av一区二区三区中文字幕 | 日韩视频中文字幕| 99re6这里只有精品视频在线观看| 久久一区二区三区四区五区| 国产亚洲精品久久久| 香蕉成人久久| 久久9热精品视频| 国产欧美日韩综合一区在线播放 | 久久久久久亚洲精品杨幂换脸 | 欧美一区二区三区在线观看视频| 欧美亚洲尤物久久| 国产精品视频xxx| 亚洲一级特黄| 亚洲欧美中日韩| 国产伦精品一区二区三区照片91| 亚洲专区在线| 久久av红桃一区二区小说| 国产欧美视频一区二区三区| 午夜伦欧美伦电影理论片| 久久国产精品久久精品国产| 国产亚洲成av人在线观看导航| 欧美亚洲一区| 蜜臀av在线播放一区二区三区| 在线精品观看| 亚洲裸体俱乐部裸体舞表演av| 欧美韩日一区二区三区| 亚洲毛片在线观看.| 亚洲一区二区精品视频| 欧美日韩在线播放三区| 亚洲午夜av在线| 欧美影院久久久| 国内精品久久久久久久影视蜜臀| 亚洲国产精品999| 欧美久久久久久久久| 99国产精品自拍| 香蕉成人伊视频在线观看| 国产欧美在线| 亚洲国产精品一区制服丝袜| 欧美精品久久99| 亚洲午夜一区| 久久天堂成人| 亚洲精品久久久久久下一站| 宅男噜噜噜66一区二区| 国产精品日韩高清| 久久国产加勒比精品无码| 欧美成人中文字幕| 亚洲午夜精品| 久久九九国产精品怡红院| 在线观看不卡av| 一区二区冒白浆视频| 国产精品日产欧美久久久久| 久久激情婷婷| 欧美人成网站| 亚洲女性喷水在线观看一区| 久久在线免费观看视频| 亚洲伦理在线免费看| 久久国产欧美精品| 亚洲国产婷婷香蕉久久久久久99 | 亚洲黄一区二区三区| 欧美日韩高清不卡| 欧美一区二区在线看| 欧美精品aa| 午夜视频精品| 欧美片在线播放| 欧美伊人久久大香线蕉综合69| 欧美激情综合亚洲一二区| 亚洲一区二区不卡免费| 蜜臀va亚洲va欧美va天堂| 中文一区在线| 免费欧美网站| 亚洲欧美日韩国产一区二区| 欧美成人一区二区三区在线观看 | 99国产精品99久久久久久| 久久精品国产999大香线蕉| 亚洲三级网站| 久久九九国产精品| 一本大道久久a久久精品综合| 久久久久久婷| 亚洲一区二区三区国产| 免费观看一级特黄欧美大片| 一区二区三区四区五区视频 | 国产伦精品一区二区三区视频孕妇 | 日韩视频免费看| 国产一区二区精品丝袜| 亚洲一区二区三区视频播放| 黄色亚洲免费| 久久国产精品72免费观看| 一本综合久久| 欧美精品99|