《科學》雜誌公佈10大年度突破,AI預測蛋白結構為首要發現

今天,《科學》雜誌評選出年度10大科學發現,AI預測蛋白結構被評為年度最主要發現。其他入選的有NASA著陸器探測到火星的覈心、創傷後應激障礙治療、新冠肺炎治療特效藥的開發、CRISPR在體基因編輯、粒子物理學標準模型的危機等,接下來主要介紹AI預測蛋白結構為何能成為年度科學突破之首。

導讀

今天,《科學》雜誌評選出年度10大科學發現,AI預測蛋白結構被評為年度最主要發現。其他入選的有NASA著陸器探測到火星的覈心、創傷後應激障礙治療、新冠肺炎治療特效藥的開發、CRISPR在體基因編輯、粒子物理學標準模型的危機等,接下來主要介紹AI預測蛋白結構為何能成為年度科學突破之首。

蛋白質的三維結構往往與生命活動過程直接相關,如果蛋白質折疊機制得到闡明就能揭示生命體的遺傳密碼,摸索出蛋白質錯誤折疊的原理也有利於闡明疾病的致病機制,從而開發出治療疾病的新療法,可以說生物醫學領域的眾多挑戰,都依賴於對蛋白質結構和功能的理解。

過去為了瞭解蛋白質結構,研究人員不得不在實驗室進行複雜精密的分析,或用不太準確的模型來類比它們,後來也一直在嘗試用電腦類比解决“蛋白質折疊問題”,但一直未能實現精准的蛋白質模型預測。

今年11月,《自然》和《科學》展示了AlphaFold和RoseTTA-fold這兩種深度學習算灋的研究成果,為相關領域研究帶來了福音。更可貴的是,研究團隊都願意將他們的程式碼數據開源,此舉大大新增了獲取蛋白質結構的可獲得性,無疑是開拓生命科學領域的壯舉。

這些論文和人工智慧系統資源的發佈,不但讓基於DeepMind開發的AI系統預測蛋白質結構的科技能够為廣大研究人員使用,而且有望進一步促進該領域的進展。囙此,《科學》雜誌主編Holden Thorg將人工智慧預測蛋白質結構評為2021年度首要突破性發現。

編譯|劉佳儀

01生物學最棘手的問題之一——蛋白質的折疊密碼

1957年,第一個蛋白質結構(肌紅蛋白)通過X射線晶體繞射的方法確定,這種以往只存在於生物學家的想像中的事物,變成了實實在在可以觀測和研究的物理模型。劍橋大學的約翰·肯德魯(John Cowdery Kendrew)由此獲得了諾貝爾化學獎。

肌紅蛋白的三級結構

1972年,諾貝爾化學獎得主安芬森(Christian Anfinsen)提出,蛋白質的折疊結構在熱力學上是穩定的,以此為基礎分析蛋白質平衡態的折疊和非折疊轉變過程,探討胺基酸序列與蛋白質3D結構的關係,提供了理論依據。

這一假說為50年來基於胺基酸序列來計算預測蛋白質3D結構的探索按下了啟動鍵。但從線性胺基酸序列中預測蛋白質分子的功能性折疊結構,以及3D空間中每個原子的位置,是非常棘手的問題,巨大的計算量和試錯成本使得每一次的預測進展緩慢。

這個後來被稱為“蛋白質折疊問題”的問題一直困擾著科學家。

02兩條路線上的研究壁壘

蛋白質的折疊模式|圖片來源:Protein Data Bank Japan

在那個年代,科學家能够描述但不能解决“蛋白質折疊”問題:蛋白質的3D結構模型難以精准預測以及視覺化,化學力場理論和分子動力學模型在這方面的應用也達到瓶頸,囙此迫切需要新的測量方法。

通常來講,確定蛋白質的空間結構有兩個方向:一種是實驗量測,包括用X射線衍射和核磁共振成像;另一種,利用電腦從已知理論和胺基酸序列等資訊出發進行理論預測,包括同源模型方法、折疊辨識類比和從頭預測法。

後來陸續有新的觀測儀器和方法出現。在低溫電子顯微鏡(cryo-EM)發明之後,蛋白質結構解析方法不斷進步,但是這種方法需要用到非常昂貴的精密儀器。多年前測定一個蛋白質的結構就有可能獲得諾貝爾獎。如今隨著科技的進步,測蛋白質結構的時間和花費已經大大地减少了,但測定一個蛋白質結構的平均費用也在100萬美元左右。

另一條路線上,研究人員一直在嘗試用電腦類比解决“蛋白質折疊問題”,但是巨大的計算量和預測的精准性是一直趕不走的“攔路虎”。

03 AI在蛋白質折疊預測應用——科技破壁者

2021年11月23日,《自然》和《科學》分別展示了兩篇AlphaFold和RoseTTA-fold的研究成果。人工智慧驅動的軟件可以實現蛋白質3D結構的精准預測,這無疑是開天闢地的壯舉。

使用AlphaFold2和結構數據建立的人類核孔複合體的模型|資料來源:Agnieszka Obarska-Kosinska

“這是兩個方面的突破,”《科學》雜誌主編霍爾頓·索普在一篇相關社論中寫道。“首先,它解决了一個僵持50年的科學問題。其次,該科技改變了一項改變遊戲規則的科技,像CRISPR體內直接編輯科技或冷凍電子顯微鏡一樣,將大大加快科學發現。”

綠色的是實驗結果;藍色的是算灋預測的結果|圖片來源:DeepMind Blog

去年11月的競賽CASP14中,穀歌的在英國的子公司DeepMind,用一種“由已知推導未知”的算灋(AlphaFold2系統)來預測蛋白質結構,其AI算灋的結果的精准性驚豔全場。

AlphaFold2的設計思路啟發了華盛頓大學研究院David Baker教授,後者的團隊後來構建了AI系統RoseTTAFold,其神經網路可以預測蛋白質複合體結構。在這個系統中,一維、二維和三維的資訊能够相互交流,讓神經網路綜合所有資訊,决定蛋白質的化學組成部分和它折疊產生的結構之間的關係。

有關這兩種算灋的論文同時發表在《自然》和《科學》雜誌上,科學家們可以自由地從這些算灋和資料庫中獲取蛋白質結構,而無需再使用蛋白質晶體或冷凍電子顯微鏡這些耗資耗時巨大的方法。

AI算灋在解决“蛋白質折疊”問題的突破是革命性的。

自1957年起,科學家揭下了第一個蛋白質的神秘面紗,之後的18年裏,共38個蛋白質結構被測出;至1980年,這個數目增長到184個。而到了2021年,有超過35萬種蛋白質結構被公開。

該科技掃除了生命科學研究的一個大障礙,將大大加快實驗性結構生物學,並有助於指導蛋白質工程和藥物發現的研究。

參考資料

https://www.antpedia.com/?uid-6096-action-viewspace-itemid-13220

https://www.dxy.cn/bbs/newweb/pc/post/9111825

https://www.cn-healthcare.com/articlewm/20210716/content-1243777.html

本文標題: 《科學》雜誌公佈10大年度突破,AI預測蛋白結構為首要發現
永久網址: https://www.laoziliao.net/doc/1656036397668540
相关資料
Nature子刊,|,研究揭示未知的神經通路,人類和其他哺乳動物的大腦可以通過這個途徑控制性成熟的過程
促性腺激素釋放激素是調節人類和其他哺乳動物有性生殖的主要激素。過去的神經科學研究發現,在人類和其他哺乳動物出生之前,產生gnRH的神經元會從鼻子中的一個稱為鼻孔的區域遷移到大腦的前部(即前腦)。研究結果表明,這些過程在雌性小鼠的性成熟過程中
標籤: 神經元細胞 哺乳綱 科學 nature 科普
西安交大科研人員研製成超臨界流體工藝領域,高性能碳化矽金屬氧化物半導體場效應電晶體
SiCMOSFET科技的成熟是當前碳化矽功率器件大規模應用最重要的科技關隘。研究表明靠近SiC/SiO2介面的碳殘留是導致高密度介面態的主要原因。然而這樣的高溫鈍化工藝,無法避免介面處再氧化而導致額外缺陷,從而嚴重限制了介面質量的提升效果。
標籤: 臨界壓力 場效應管 半導體產業
上海交大金放鳴研究團隊在PNAS發表研究,自然啟迪的二氧化碳水熱還原產長鏈烷烴
上海交通大學為第一完成和通訊組織,合作單位和作者包括中國科學院化學研究所院士韓布興與廈門大學教授王野。面對這一重大科學問題,金放鳴研究團隊通過類比地球蛇紋石鐵鈷礦的組成和水熱環境,以一般鐵粉為還原劑,鈷粉為催化劑,在300度和300個大氣壓
標籤: 科技新聞
大氣所,|,JC,揭示出ENSO對京津冀前冬和後冬霧霾污染影響的差异及成因
一些研究認為,ENSO對冬季京津冀地區霧霾污染事件的發生有重要的貢獻;然而,另一些研究則指出ENSO對包括京津冀城市群在內的華北區域霧霾污染的影響很弱。囙此,關於ENSO能否影響京津冀地區冬季霧霾事件存在很大的爭議。
標籤: 霧霾 環境保護 空氣污染 環境污染