《電子技術應用》
您所在的位置:首頁 > 可編程邏輯 > 解決方案 > 速度提高100萬倍,哈佛醫(yī)學院大神提出可預測蛋白質結構的新型深度模型

速度提高100萬倍,哈佛醫(yī)學院大神提出可預測蛋白質結構的新型深度模型

2019-04-21

蛋白質結構預測是生命科學領域的一大難題。近日,來自哈佛大學醫(yī)學院的研究人員提出了一種基于氨基酸序列預測蛋白質結構的新方法,準確率可媲美當前最佳方案,但預測速度提升了100萬倍。

微信圖片_20190421161859.jpg


生命所必需的每一次基礎生物學進展幾乎都是由蛋白質帶來的。蛋白質參與創(chuàng)建細胞和組織并保持著它們的形狀;構成維持生命所需化學反應的催化酶;充當分子工廠、轉運工具和馬達;充當細胞通訊的信號和接收器等等。


蛋白質由很多氨基酸長鏈組成,通過折疊成精確的 3D 結構來完成無數(shù)的任務,這些結構控制著它們與其它分子互動的方式。蛋白質的形狀決定了其功能以及它在疾病中的功能紊亂程度。闡明蛋白質的結構是所有分子生物學的核心,更是治療患者、拯救生命、改變生活的醫(yī)學發(fā)展的核心。


近年來,根據(jù)氨基酸序列預測蛋白質折疊結構方面的計算方法已經取得了很大進展。如果能夠充分實現(xiàn),這些方法可能會改變生物醫(yī)學研究的方方面面。然而,現(xiàn)在的方法在可測定的蛋白質的大小和范圍上是有限的。


最近,哈佛大學醫(yī)學院 Blavatnik 研究所系統(tǒng)生物學家 Mohammed AlQuraishi 發(fā)布了一項新的研究,他根據(jù)氨基酸序列,利用深度學習實現(xiàn)了任意蛋白質 3D 結構的高效預測。在 4 月 17 日的 Cell Systems 期刊中,Mohammed AlQuraishi 詳細介紹了這種通過計算確定蛋白質結構的新方法,利用該方法實現(xiàn)的準確率可媲美當前最佳方案,但速度提高了 100 萬倍。


論文:End-to-end differentiable learning of protein structure

論文地址:https://www.biorxiv.org/content/biorxiv/early/2018/08/29/265231.full.pdf

項目地址:https://github.com/aqlaboratory/rgn

微信圖片_20190421161947.jpg

原論文表 2:蛋白質結構預測方法的訓練和預測速度對比。


如上所示,AlQuraishi 提出的循環(huán)幾何網絡在預測速度上快了 6 到 7 個數(shù)量級。其中上表第一行是目前已經建立起來的復雜方法,這些方法嚴重依賴于模擬和采樣。第二行對應于協(xié)同演化(co-evolution)的方法,它也會有一個學習過程。最后一行就是作者提出的一種端到端的可微分方法。


「蛋白質折疊是近半個世紀以來生物化學家研究的重要問題之一,此次提出的方法為解決這一問題提供了全新的思路,」AlQuraishi 說道。「現(xiàn)在我們有了一個探索蛋白質折疊的全新方法,我覺得我們現(xiàn)在的研究不過是冰山一角。」

AlQuraishi 研究的特點在于,一名埋頭在哈佛醫(yī)學院和波士頓生物醫(yī)學社區(qū)豐富研究生態(tài)系統(tǒng)中的研究人員,居然能夠在計算機科學最熱門的領域里抗衡谷歌等巨頭。——Peter Sorger

說起來簡單


雖然成功率高,但利用物理工具來鑒別蛋白質結構的過程既昂貴又耗時,即使是使用現(xiàn)代技術(如低溫電子顯微鏡)同樣如此。因此,絕大多數(shù)蛋白質結構以及致病突變對這些結構的影響目前仍是未知的。


蛋白質折疊方式的計算方法有可能大大降低確定蛋白質結構的成本和時間。但經過近四十年的不懈努力,這個難題仍未解決。

微信圖片_20190421162037.gif

可視化模擬 AlQuraishi 的蛋白質折疊深度學習方法。模型通過反復預測某個結構(彩色)并將其預測與真實結構(灰色)對比來實現(xiàn)自訓練。對數(shù)千種已知蛋白質重復此步驟,模型在每次迭代中都會學習并提高自己的準確率。


蛋白質由 20 種不同的氨基酸組成。這些氨基酸就像字母表中的字母,組合成單詞、句子、段落,產生了無數(shù)種可能的文本。然而,與字母不同,氨基酸是位于 3D 空間的物理存在。通常,蛋白質的各個部分在物理上非常接近,但在序列上卻相隔很遠,因為其氨基酸鏈形成了環(huán)、螺旋、折疊等不同形狀。


AlQuraishi 表示,「這個問題引人注目的地方在于它說起來簡單:挑一個序列,想辦法弄清楚它的形狀就可以了。蛋白質從一個非結構化的線開始,必須呈現(xiàn) 3D 形狀,線可能折疊成的形狀有很多種。許多蛋白質有上千個氨基酸長,其復雜性遠遠超過人類直覺甚至強大的計算機。」


做起來難


為了應對這一挑戰(zhàn),科學家利用氨基酸的特點,即它會在物理法則的約束下相互作用,從而尋找更具潛力的狀態(tài)。目前最先進的算法通過超級計算機或眾包計算來尋找蛋白質結構,它們基本上都是在模擬極其復雜的氨基酸物理相互作用。為了降低這些方法對大規(guī)模計算的需求,它們依賴于將新序列映射到預定義的模板,且這些蛋白質結構模板都是之前通過實驗確定的。


其它如 DeepMind 的 AlphaFold 則采用了另一種方法,它利用深度學習進一步預測蛋白質結構。這類方法會分析大量的基因數(shù)據(jù),其內在包含了蛋白質的設計藍圖,目前受到了極大的關注。


AlphaFold 是之前非常受關注的一項研究,它利用神經網絡來預測氨基酸對之間的距離,以及連接它們的化學鍵之間的角度。AlphaFold 參加了 CASP 競賽,它首次參賽就在 98 名參賽者中名列榜首,準確地從 43 種蛋白質中預測出了 25 種蛋白質的結構,而同組比賽中獲得第二名的參賽者僅準確預測出了 3 種。


然而,這些 AI 方法并不能僅基于蛋白質的氨基酸序列預測結構。這一點會限制 AlphaFold 等方法的能力,因為在沒有先驗知識的情況下它們很難決定蛋白質結構,其在演化獨特的蛋白質或手工設計新蛋白質上能力有限。


針對這些問題,AlQuraishi 主要從四個核心概念出發(fā)構建新的解決方案。首先我們應該要使用循環(huán)神經網絡編碼蛋白質序列;其次通過扭轉角度參數(shù)化局部蛋白質的結構,從而允許模型在不破壞共價化學性質的情況下對各種結構進行推理;再者,我們還應該通過循環(huán)幾何單元耦合局部蛋白質結構和它的全局表征;最后,使用一種可微損失函數(shù)來捕捉預測結構與實際結構之間的差別。


端到端的可微分學習


為了開發(fā)新的方法,AlQuraishi 應用了一種名為端到端的可微分深度學習方法。本質上而言,可微分學習涉及到一種單獨的強力數(shù)學函數(shù):神經網絡,通過神經元的前饋傳播與反向傳播,可微分學習能逐漸學習到各種「專業(yè)知識」。


神經網絡這種函數(shù)能在極其復雜的特征空間上調整自身,以便精確地學習蛋白質序列與其結構之間的數(shù)學關系。AlQuraishi 就構建了一種名為循環(huán)幾何網絡(Recurrent Geometric Network)的深度學習模型,它側重建模蛋白質折疊的關鍵特征。


循環(huán)幾何網絡


模型輸入一個氨基酸序列和 PSSM(具體位置的評分矩陣)并輸出一個 3D 結構。它由三個階段組成:計算、幾何建模和評估——因此將其稱為循環(huán)幾何網絡(RGN)。


第一階段由計算單元組成,對于每個殘基位置(residue position),計算單元將關于氨基酸和 PSSM 的信息與來自相鄰單元的信息整合。通過將這些單元放在循環(huán)雙向拓撲結構中(圖 2),對每個殘基的計算整合了從殘基上游和下游一直到 N-和 C-端的信息,覆蓋了整個蛋白質。

微信圖片_20190421162230.jpg

原論文圖 2:循環(huán)幾何網絡主要過程。


第二階段由幾何單元組成,該幾何單元輸入給定殘基的扭轉角和由其上游的幾何單元產生的部分完成的骨干,并輸出由一個殘基延伸的新骨干,該骨干被輸入至相鄰的下游單元。最后的單元輸出蛋白質的完整 3D 結構。


在模型訓練期間,第三階段使用基于距離的均方根誤差(dRMSD)度量來計算預測結構和實驗結構之間的誤差。dRMSD 首先計算預測結構中所有原子和實驗結構中所有原子的成對距離(分別計算),然后計算這些距離集合之間的均方根。

微信圖片_20190421163610.gif


如上展示了循環(huán)幾何網絡模型如何計算氨基酸之間鍵的角度以及這些鍵周圍的旋轉角,獲取這兩個信息就可以采集蛋白質結構的幾何形狀。動畫:Mohammed AlQuraishi。


對于每個氨基酸,模型預測連接其與相鄰氨基酸的化學鍵最可能的角度。它還預測這些鍵周圍的旋轉角,這影響了蛋白質的任何局部在幾何上與整個結構的關系。


這個過程會重復進行,每次計算都需要使用和提煉所有其它氨基酸的相對位置信息。一旦整個結構完成,模型會將預測結果與蛋白質的「標注真值」結構進行比較,以檢查其預測準確率。


這整個過程在成千上萬種已知的蛋白質中重復進行,模型在每次迭代中學習并提升其準確率。


新的前景


一旦其模型訓練好,AlQuraishi 會測試它的預測能力,它們將該模型與近年來蛋白質結構預測關鍵評估(CASP)的其它方法進行了比較。CASP 是一個年度實驗,它通過已經確定但未公開的蛋白質結構測試各種預測方法的能力。


他發(fā)現(xiàn)在沒有預先設計的模板時,新模型在預測蛋白質結構方面遠遠優(yōu)于其它方法,包括使用協(xié)同演化數(shù)據(jù)的方法。當預定義模板可用于預測時,新模型還是優(yōu)于最佳方法之外的其它方法。


雖然提升并不大,但這種方法表示了一類新的蛋白質折疊預測方法,它與現(xiàn)有的方法是互補的關系。值得注意的是,新模型的預測速度比現(xiàn)有計算方法快 6 到 7 個數(shù)量級。訓練模型可能需要數(shù)月,但一旦訓練完成,預測新蛋白質結構可以在幾毫秒內完成。這種加速在于深度網絡是一種獨立的數(shù)學函數(shù),它只需要幾千行代碼而不是數(shù)百萬行代碼就能完成。


這種極速使得蛋白質預測變得更加簡單,以前無法想象的應用也都會慢慢冒出來。AlQuraishi 表示:「新模型還沒有立即用于新藥開發(fā)或設計,因為它的準確度大約在 6 埃(一億分之一厘米)左右,與解決蛋白質原子結構所需的 1 到 2 埃還有一定距離。」


但是在深度學習快速發(fā)展的今天,這種方法將越來越強大,例如如何進一步整合化學和物理知識就值得我們認真探討。也許以后的新藥開發(fā)成本會越來越低,醫(yī)療費用也會越來越低。


本站內容除特別聲明的原創(chuàng)文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內容無法一一聯(lián)系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
久久免费黄色| 国产精品盗摄一区二区三区| 亚洲人体偷拍| 欧美一级专区免费大片| 亚洲一二三四久久| 99精品国产福利在线观看免费| **网站欧美大片在线观看| 国内免费精品永久在线视频| 国产精品一区二区久久久| 欧美午夜片在线观看| 欧美激情一区二区三级高清视频| 美国十次成人| 另类av一区二区| 久久免费视频在线| 久久久久久久综合| 久久国产手机看片| 久久精品亚洲一区| 久久久在线视频| 免费看黄裸体一级大秀欧美| 另类激情亚洲| 农村妇女精品| 欧美精品久久一区二区| 欧美高清不卡| 亚洲激情自拍| 国产精品色婷婷| 国产精品国产三级国产普通话99| 欧美天天视频| 欧美三级乱人伦电影| 欧美视频一区二区三区| 欧美午夜理伦三级在线观看| 国产精品狠色婷| 国产精品自拍视频| 国产一二三精品| 影院欧美亚洲| 亚洲激情综合| 亚洲毛片在线免费观看| 一本色道久久综合| 亚洲一区二区三区精品在线| 亚洲欧美日韩视频二区| 久久精品国产精品亚洲| 亚洲激情在线视频| 9久re热视频在线精品| 亚洲一区免费观看| 欧美在线观看视频在线| 久久免费国产| 欧美激情一区二区在线| 欧美日本免费| 国产精品私房写真福利视频| 国产日产亚洲精品| 一区二区亚洲精品| 99精品国产在热久久下载| 亚洲免费影视第一页| 久久精品91久久香蕉加勒比| 亚洲精品在线免费| 午夜国产精品影院在线观看| 久久亚洲精品网站| 欧美日本一道本| 国产麻豆成人精品| 亚洲第一伊人| 亚洲视屏在线播放| 亚洲二区在线观看| 亚洲婷婷综合色高清在线| 久久精品123| 欧美激情一二区| 国产女人aaa级久久久级| 在线精品高清中文字幕| 一区二区三区免费网站| 久久国产主播精品| 亚洲视频在线看| 久久一综合视频| 欧美视频一区二区| 精品91视频| 亚洲综合日本| 99精品视频免费观看视频| 欧美一区二区在线免费播放| 欧美福利视频在线| 国产精品美女www爽爽爽| 在线观看视频一区二区欧美日韩 | 国产伦精品一区| 亚洲国产精品精华液网站| 亚洲一区在线播放| 亚洲精品国产拍免费91在线| 欧美综合国产精品久久丁香| 欧美日韩国产小视频| 黄色成人91| 亚洲与欧洲av电影| av不卡在线| 玖玖国产精品视频| 国产欧美日韩精品a在线观看| 亚洲乱码精品一二三四区日韩在线| 香蕉久久久久久久av网站| 亚洲一级二级| 欧美精品免费在线观看| 国模 一区 二区 三区| 一区二区久久久久久| 亚洲美女黄网| 免费精品视频| 好男人免费精品视频| 亚洲欧美一级二级三级| 亚洲综合三区| 欧美日韩国产a| 亚洲国产你懂的| 亚洲电影中文字幕| 久久久久久久久久久久久9999 | 日韩亚洲欧美一区| 亚洲精品九九| 麻豆久久精品| 国产在线播精品第三| 亚洲男人第一av网站| 亚洲一区日韩| 欧美性片在线观看| aaa亚洲精品一二三区| 亚洲精品日韩在线观看| 巨乳诱惑日韩免费av| 国内精品国产成人| 性视频1819p久久| 欧美在线一区二区| 国产精品一区二区在线观看网站| 中国av一区| 亚洲欧美一区二区三区久久 | 国产精品日韩欧美一区二区| 亚洲最新色图| 亚洲性线免费观看视频成熟| 欧美日韩国产精品| 亚洲美女诱惑| 夜夜嗨av色综合久久久综合网| 欧美大片在线观看一区| 欧美二区不卡| 亚洲欧美日韩国产精品| 一区二区三区四区在线| 欧美激情第4页| 亚洲国产日韩欧美| 国产精品日本一区二区| 欧美日韩精品欧美日韩精品| 亚洲高清不卡在线观看| 亚洲破处大片| 欧美精品七区| 日韩西西人体444www| 一区二区三区毛片| 国产精品白丝黑袜喷水久久久 | 在线观看成人av| 亚洲国产成人porn| 久久综合福利| 亚洲国产精品福利| 一本久道久久综合狠狠爱| 欧美日韩视频免费播放| 亚洲小说欧美另类社区| 欧美一级淫片aaaaaaa视频| 国产亚洲精品美女| 亚洲电影免费观看高清完整版在线| 欧美 日韩 国产 一区| 亚洲精品国产欧美| 亚洲免费视频成人| 欧美大片免费观看| 亚洲精品色婷婷福利天堂| 亚洲午夜av在线| 国产精品一二三视频| 欧美在线一区二区| 欧美国内亚洲| 一区二区三区精密机械公司| 欧美一区二区三区免费大片| 黄色成人精品网站| 在线一区日本视频| 国产手机视频精品| 亚洲精品三级| 国产精品久久波多野结衣| 欧美亚洲三区| 欧美福利视频一区| 亚洲一区二区三区乱码aⅴ蜜桃女| 久久久久国色av免费观看性色| 亚洲高清不卡av| 亚洲欧美日韩综合国产aⅴ| 精品电影一区| 亚洲特黄一级片| 国内精品久久久久久久影视蜜臀| 亚洲美女av网站| 国产欧美va欧美va香蕉在| 亚洲人成在线观看一区二区| 国产精品成人一区二区网站软件 | 欧美日韩久久| 香蕉av777xxx色综合一区| 欧美成人一区二区三区| 亚洲一区二区免费在线| 欧美大片免费久久精品三p| 亚洲专区在线| 欧美精品久久久久久久| 香蕉视频成人在线观看 | 欧美日韩一区二区三区在线看 | 亚洲精品日韩在线| 国产精品视频九色porn| 91久久精品日日躁夜夜躁国产| 国产精品白丝av嫩草影院| 91久久久久| 国产毛片一区| 一本色道久久综合亚洲精品小说| 国内精品久久久久伊人av| 亚洲性视频h| 亚洲国产国产亚洲一二三| 久久xxxx| 亚洲视频狠狠|