人工智慧新模型可解碼DNA隱藏“語言”

理解這些資訊是如何存儲和組織的,一直是20世紀最大的科學挑戰之一。現在,借助GROVER這一基於人類DNA訓練的新型大型語言模型,研究人員有望解碼基因組中隱藏的複雜資訊。

基於DNA序列訓練的大型語言模型(藝術圖)。圖片來源:物理學家組織網

科技日報北京8月6日電(記者張佳欣)DNA包含了維持生命所需的基礎資訊。理解這些資訊是如何存儲和組織的,一直是20世紀最大的科學挑戰之一。現在,借助GROVER這一基於人類DNA訓練的新型大型語言模型,研究人員有望解碼基因組中隱藏的複雜資訊。GROVER由德國德勒斯登工業大學生物技術中心開發,它將人類DNA視為文字,通過學習其規則和上下文來選取DNA序列的功能資訊。這一新工具有望徹底改變基因組學並加速個性化醫療的發展。相關研究論文發表在新一期《自然·機器智能》雜誌上。

大型語言模型通過文字訓練,發展出了在多種脉络下使用語言的能力。研究人員設想將生命程式碼DNA當作一種語言,訓練了一個大型語言模型——GROVER。

在語言方面,人們談論的是語法、句法和語義。而對於DNA來說,這意味著學習核苷酸的序列等。就像GPT模型學習人類語言一樣,GROVER基本上學會了DNA“語言”。

研究表明,GROVER不僅能準確地預測接下來的DNA序列,還可用來選取具有生物學意義的上下文資訊,例如識別DNA上的基因啟動子或蛋白質結合位點。此外,GROVER還學習了“錶觀遺傳”過程,即在DNA序列不發生改變的情况下,基因表達的可遺傳變化。

GROVER有望解鎖DNA中蘊含著關於人類本質、疾病易感性以及對治療反應的關鍵資訊。研究人員相信,通過語言模型理解DNA的規則,將有助於揭示隱藏在DNA中的生物意義,從而推動基因組學和個性化醫學發展。

資料標籤:
本文標題: 人工智慧新模型可解碼DNA隱藏“語言”
永久網址: https://www.laoziliao.net/doc/1723025532624661
相关資料
抗衰老治療研究獲突破,再生基因移植恢復幹細胞活力
科技日報北京8月6日電(記者張夢然)據日本東京大學官網最新報導,該大學藥學研究生院團隊發現,將能再生身體的簡單生物體基因轉移到普通果蠅體內,轉移後的基因抑制了果蠅與年齡相關的腸道問題。這表明具有高再生能力的動物基因,或會恢復幹細胞功能並延長
標籤:
多厚的紙容易割傷手指?
人們似乎很難避免被紙張割傷。雜誌、信件和書籍都隱藏著能輕微割傷人皮膚的潜力。
標籤:
電繃帶有望加速慢性傷口癒合
科技日報北京8月7日電(記者張佳欣)美國北卡羅來納州立大學研究人員開發了一種價格低廉的繃帶,可利用電場促進慢性傷口的癒合。在動物實驗中,使用這種電繃帶治療傷口比使用傳統繃帶癒合速度快30%。
標籤:
“太極-Ⅱ”光晶片首次實現大規模光訓練
科技日報北京8月7日電(記者華淩)記者7日從清華大學獲悉,該校電子系方璐教授課題組與自動化系戴瓊海教授課題組在智慧光晶片領域取得重大進展。他們首創全前向智慧光計算訓練架構,研製出“太極-Ⅱ”光晶片,實現了大規模神經網路的原位光訓練,為人工智
標籤: