生物逆向工程設計在合成生物學中的應用

系統生物學逆向工程的研究思路與合成生物學設計過程的一致性,啟發了我們利用逆向工程指導合成生物學的理性設計。逆向工程應用到合成生物學,將大大降低複雜功能回路的設計難度。

合成生物學是一門涉及生物學、生物工程學、系統生物學、數學、物理、化學與資訊科學的新生的交叉學科。它的目的是在工程化思想的指導下有目的地、可預測地設計人造生命系統。經過近二十年的蓬勃發展,合成生物學取得了重大成就,但依舊面臨複雜系統理性設計的困難。在系統生物學中,運用數學物理等知識根據網路功能來研究功能背後網絡結構的方法被稱為逆向工程。系統生物學逆向工程的研究思路與合成生物學設計過程的一致性,啟發了我們利用逆向工程指導合成生物學的理性設計。逆向工程應用到合成生物學,將大大降低複雜功能回路的設計難度。本文從合成生物學的設計思路與問題出發,根據本文作者研究團隊近十年來在逆向工程研究中的經驗,歸納總結了現時逆向工程設計在合成生物學中的應用方法,包括網絡窮舉方法、子網絡拼接方法、從離散模型到連續模型的方法,論證了逆向工程指導合成生物學理性設計的可行性與有效性,分析了現時逆向工程設計在合成生物學中的發展瓶頸。

1生物系統正向工程與逆向工程的研究方法

系統生物學著重關注生物系統的複雜相互關係,利用非線性動力學、複雜系統理論與統計物理等方法探索生物調控網絡的特性,包括生物調控網絡的網絡拓撲學特徵、動力學特徵、功能特徵,以及三者之間的相互制約關係。根據研究網絡尺度等特點的不同,我們可以選擇不同的數學模型進行研究,包括離散模型、連續模型,隨機模型、確定性模型等。這種根據已知的蛋白質、基因間的相互作用構建動力學方程,研究系統的動力學性質、解釋或預測生物調控網絡的功能和現象的方法被稱為正向工程。然而,在更多時候,人們並不瞭解生物系統中的具體相互關係,僅能宏觀量測到系統具有的特定功能。出於對生物調控網絡結構的探索,研究者運用數學物理等知識找到了可以根據網路功能來研究功能背後的網絡結構的方法。這種根據功能探尋生物網絡結構的方法與正向工程的思路相反,囙此被稱之為逆向工程。

在系統生物學幫助我們深刻理解生物系統後,研究者萌發了有目的地改造生命系統的想法,並綜合其他學科的思想從頭設計並創造具有新功能的生命系統,合成生物學應運而生。電子工程因自下而上的設計思路取得了重大的成功,這啟發了合成生物學借用這種思路進行自下而上的正向工程設計,即借用電子學中數位電路設計的設計理念,通過理性設計,將元件組裝成器件,器件集成模塊,模塊構建複雜的生物系統,最終封裝在生物體中使其成為一個能執行預定功能的生物機器。基因振盪器與遺傳雙穩態開關是合成生物學在理論指導下合成的第一批生物元件,它們的實現表明了理性設計生物元器件的可行性,是“合成生物學的里程碑”。隨後,研究者發掘出了越來越多的標準元件,並利用這些標準化的生物元件構建了多種多樣的基本邏輯門,進一步組裝構建了眾多具有全新功能的生物系統,如具有捕食者-獵物生態系統特點的大腸桿菌生態系統、能產生青蒿素的酵母細胞、具有巴甫洛夫條件反射的細胞、具有計算能力的哺乳動物細胞、揭示生物菌落遷徙進化中競爭規律的生物系統、利用協同組裝實現複雜信號處理的酵母細胞、僅有單條染色體的酵母細胞等。合成生物學家在設計並創造這些全新生命系統的過程中進一步加深學習和理解了自然生命系統的運作規律。然而,這種系統工程化的設計思想忽視了電子系統與生物系統的顯著差异,即簡單系統與複雜系統的差异。複雜系統設計中必須重點考慮的系統與狀態穩定性、分叉現象(湧現現象)及强關聯性等,都是現時正向工程設計沒有考慮的。這些問題限制了合成生物學家對複雜功能生物網絡的設計與實現。

逆向工程研究的思路與合成生物學設計過程具有一致性,並可以解决或部分解决設計複雜系統所遇到的問題,這啟發了我們利用逆向工程指導合成生物學的理性設計。逆向工程應用到合成生物學,將大大降低複雜功能回路的設計難度,降低合成生物學功能回路的構建難度。

2逆向工程指導合成生物學理性設計的方法

根據數學模型的不同,逆向工程指導合成生物學理性設計的方法大體上可以分為基於微分方程的逆向工程和基於布林網絡的逆向工程。

2.1基於微分方程的逆向工程

研究連續系統常用的工具是微分方程。微分方程模型是基於熱力學極限的平均場模型。它將分子濃度當作連續變數,用一階常微分方程描述系統的動力學行為,如式(1)。

(1)

式中,x=(x1x2,···,xi,···xnTp=(p1p2,···,pi,···pnTf=(f1f2,···,fi,···fnTxi表示節點對應的濃度,pi為模型中的參數,fi為系統相互關係對應的方程形式。系統將根據初態和微分方程指定的約束條件在相空間中沿著確定的軌跡演化。

網絡窮舉是基於微分方程的逆向工程方法之一,也是逆向工程設計網絡結構的較為成熟的方法。通過限定研究網絡尺度保留網絡間相互作用的複雜形式,網絡窮舉幫助我們尋找更多具有特定功能的未知網絡結構,加深我們對生物網絡結構與功能關係的理解和研究。研究者通過目標功能提出相應的模型假設與目標函數,在網絡結構全空間中遍歷計算所有特定節點的網絡,根據目標功能和適當的網路功能評估名額篩選出全域最優的網絡結構。通常我們將網路功能的魯棒性作為功能評估名額,用來衡量網路功能對參數的敏感性。網絡的魯棒性越高,功能抵抗參數擾動的能力就越强。在具體計算過程中,常用Q值表徵網絡的魯棒性,Q值是網絡參數在合理的參數空間下進行拉丁超立方隨機採樣時能够實現目標功能的隨機參數的比例,滿足如式(2)條件。

(2)

式中,n為在參數空間中隨機採樣的總套數,有m套隨機參數能够實現目標功能。

網絡窮舉的方法因為能精確類比動力學過程,幫助我們探索具有目標功能的未知網絡結構,被廣泛應用在研究網絡結構的設計中,包括適應性、果蠅發育的極性建立、計量響應吻合性、自組織細胞極化、圖靈斑圖、振盪週期的溫度補償性、生物濾波器等。例如,在適應性的研究中,作者引入靈敏性(sensitivity)和適應準確性(adaptation precision)這兩個特徵量來定量刻畫適應性功能。其中,靈敏性名額是網絡的響應輸出最大值與初始輸出值的比,適應準確性是網絡在輸出狀態恢復穩定後相對初始輸出的比值的倒數,用來表徵輸入信號變化前後對應的穩定輸出信號的差异。具有適應性的網絡應該具有對輸入信號靈敏響應的能力(靈敏性>1)和準確適應的能力(適應準確性>10)(圖1)。同時,模型假設每個節點有啟動和非啟動兩種可相互轉換的狀態,且兩種狀態對應的蛋白質濃度之和是一定的。通過上述模型假設,遍歷計算所有可能的三節點酶促反應網絡。在每一個網絡拓撲結構的具體計算中,研究者根據網絡拓撲結構寫出對應調控的微分方程組,在參數空間進行拉丁超立方隨機採樣進而類比動力學過程,通過計算相應參數下的靈敏性和適應準確性這兩個特徵量,來最終確定實現適應性的參數套數,即網絡拓撲結構的Q值(圖2)。通過表徵網絡魯棒性的Q值,研究者篩選出了能較好實現完美適應的最小網絡,分別是帶有緩衝節點的負反饋網絡(NFBLB)和非一致前饋網絡(IFFLP)(圖3)。

圖1適應性的數學描述

圖2網絡窮舉研究適應性功能的特定網絡結構的計算過程

圖3能較好實現完美適應的最小網絡

雖然網絡窮舉的方法可以幫助我們理解網路功能與結構的關係,但是現時電腦的計算能力限制了模型的進一步發展。對於三節點網絡,網絡窮舉法需要遍歷計算39=19 683個網絡拓撲結構,其中對於每一個網絡結構,當隨機參數的採樣數n=10 000時,總計算量將達到億量級,耗時若干天;對於四節點網絡,網絡窮舉法需要計算316=43 046 721個網絡拓撲結構,如果每個網絡結構選取10 000組隨機參數進行計算,總計算量將達到千億量級,完成計算大概需要至少19年時間。網絡節點數的微小新增對計算能力的挑戰是巨大的。囙此,現時大多數的網絡窮舉方法只能用在節點數不超過3個的網絡中。

但是複雜的功能通常伴隨著複雜的網絡結構出現,三節點網絡並不能滿足我們對複雜功能網絡的研究需求。前人的大量研究表明,特定的調控模塊被廣泛使用在不同的生物系統中,這啟發了我們可以從模組化的角度來研究具有複雜功能的生物網絡。我們將網絡窮舉與模組化的思路相結合,提出了子網絡合併的研究方法。這種方法削弱了網絡窮舉對研究網絡尺度的限制,拓展了網絡窮舉方法的研究範圍。該方法的覈心思想是:先將複雜的目標功能折開成若干簡單的子功能,然後利用三節點網絡窮舉的方法篩選出子網絡,再根據子網絡合併的管道將不同子網絡中的節點合併以形成大的組合網絡,最終從大的組合網絡中挑選出具有目標功能且魯棒性高的網絡。例如,在設計具有巴甫洛夫條件反射的複雜功能的網絡中,先將網絡的總功能劃分為記憶和響應兩個子功能模組,用蛋白質相互作用和基因轉錄調控兩個層面的網絡窮舉方法篩選出了合適的記憶網絡和響應網絡,然後將子網絡合併後篩選得到最終具有目標功能的生物調控網絡(圖4)。為了保證節點合併的合理性,引入的節點合併的邏輯限制主要在於被合併在一起的兩個節點接收的輸入信號間、調控關係間均不能相互衝突,以及合併後的節點產生的輸出信號間不能相互衝突。節點合併時,分別從兩個子網絡庫中各取一個網絡,根據節點合併的邏輯限制,分別以合併一個節點、兩個節點以及三個節點的順序類比節點合併後的組合網絡的功能,篩選得到最終具有目標功能的生物調控網絡。與合成生物學實驗中利用邏輯代數正向設計的巴甫洛夫條件反射調控網絡相比,我們發現用子網絡合併法得到的組合網絡具有更高的魯棒性,其Q值可以提高1~2個數量級,這凸顯了逆向工程方法的優越性。此外,我們還將子網絡合併的方法運用到具有多功能訊號編碼性質的信號傳導網路設計中,找到了能在不同的刺激條件下分別產生振盪、適應性和持續性啟動三種功能的網絡結構,最終實現了多功能訊號編碼的信號傳導網絡。這種子網絡合併的方法不僅擴大了生物調控網絡的研究尺度(圖5),而且幫助我們從複雜功能與簡單模塊的角度加深了對網絡結構與功能的理解。

圖4子網絡合併法得到的最優調控網絡

圖5傳統網絡窮舉與子網絡合併的計算複雜度對比

現時已經有許多逆向工程指導合成生物學理性設計的研究工作,但大部分工作停留在理論計算層面,缺乏後續的實驗驗證。合成生物學驗證實驗的缺乏讓我們無法知道逆向工程可以對合成生物學理性設計的指導程度。這不僅阻礙了我們對複雜系統運行規律的進一步學習和理解,而且限制了合成生物學的發展,不利於合成生物學解决能源、資源、環境、醫療健康等問題。所以,將逆向工程的理論與合成生物學的實驗結合起來顯得格外重要。我們首次將逆向工程的理性設計與合成生物學實驗相結合,通過三節點網絡窮舉篩選出了具有超敏開關特性的生物調控網絡,進而利用合成生物學的手段實現了超敏細胞密度開關的理性設計,初步驗證了逆向工程指導合成生物學理性設計的可行性(圖6)。在研究中我們發現並非所有理論設計的網絡都能在實驗中被成功構建,所以需要依據實驗經驗進一步篩選網絡。考慮到實驗中需要使用的元件特性,我們提出了具體的實驗可行性限制條件,即節點AB對節點XX=ABC)的調控關係必須一致(圖6)。我們將實驗可行性限制條件引入到了網絡窮舉篩選網絡的過程中,挑選出了既具有理論指導意義又具有實驗可行性的網絡結構庫,並從中選取了相互作用最簡單且魯棒性最好的網絡進行實驗構建。為了實現從逆向工程到正向工程的過渡,我們對最簡網絡進行了理論計算分析,找到了超敏效能與在實驗上可以控制並調節的參數之間的約束關係,即節點A的自啟動能力越强網絡的整體超敏效能越好。進而根據理論分析的結果選取了滿足參數理論要求的實驗元件,精確組裝出了具有可預測能力的超敏細胞密度開關,發現實驗中參數對功能的影響符合理論預測(圖7),實現了僅用單個元件獨自表徵時的動力學參數就能預測元件組裝後的基因線路功能與效能的目標。在結合理論計算與實驗驗證的過程中,引入實驗可行性限制既在理論指導實驗的層面上幫助實驗從全域穩定性角度得到了魯棒性最好的複雜網路結構設計,又在實驗指導理論的層面上幫助理論計算從實驗經驗中抽象出了新的生物回路設計標準,進一步說明了逆向工程與正向工程的結合讓系統生物學與合成生物學相互促進、共同發展。

圖6網絡窮舉指導細胞密度超敏開關實驗構建的流程

圖7參數的理論預測與實驗量測

2.2基於布林網絡的逆向工程

微分方程模型雖然能够定量地描述網絡動力學特徵,但對計算能力的要求也很高。與連續模型的精細刻畫不同,離散模型雖然在很多情况下只能給出定性或半定量的結果,但是可以幫助我們研究更大尺度的生物調控網絡。布林網絡是最簡潔的離散邏輯模型。布林網絡中的每個節點僅有“0”“1”兩種狀態,對應分子表達的高低兩態,模型將節點間的調控關係簡化成啟動或抑制兩種狀態。N個節點的網絡在任一t時刻,所有節點狀態用長度為N的向量St)表示,其中Si表示節點i的狀態,Si=0(低態)和Si=1(高態),節點間的相互作用由aij表示。節點狀態的變化由布林方程Sit+1)=Fi[St)]確定,具體形式如式(3)。

(3)

由於模型的簡潔性,布林網絡模型被廣泛應用於基因調控網絡和信號傳導通路的全域動力學特性研究,例如,研究者構建了包含11個節點的芽殖酵母細胞週期調控網絡,用布林方程的演化規則,遍歷計算211種初始狀態的演化,發現了所有的初始狀態均演化到7個靜止狀態(fixed point)中的某一個,其中約86%的初始狀態均演化到了G1期對應的穩態上,顯示了生物網絡的全域穩定性。另外,研究者還發現網絡的動力學軌跡是一個一維中心流形,因而其生物學路徑也是全域穩定的。

基於布林網絡的逆向工程方法將網絡間的相互作用視作邏輯變數,根據網絡中重要節點的動力學路徑與布林演化規則,推導生物調控網絡的反向公式,進而獲得網絡的結構資訊。具體而言,t時刻的節點狀態作為輸入,t+1時刻的節點狀態作為輸出,節點i對節點j的調控用邏輯變數gijrij表示:節點i抑制節點jrij=true,否則rij=false;節點i啟動節點jgij=true,否則gij=false;節點i與節點j無相互作用時gij=false,rij=false。由於節點i對節點j的調控是單一的,不會同時存在啟動和抑制,故gij·rij=false。綜合節點變化的所有情况,我們有如式(4)。

(4)

所有節點在整個動力學路徑演化下均滿足公式(4)。通過利用强抑制模型(rij=−∞)和具體的動力學資訊對公式(4)進行求解,方程組的解可以轉化成析取範式形式(僅以邏輯“與”連接各項的形式),進而得到調控關係。

一般基於布林網絡的逆向工程方法需要從特定的動力學軌跡出發。由於動力學軌跡提供的網絡約束是有限的,當我們通過目標功能的一條動力學軌跡進行推導時,將會得到一個數量龐大的可能網絡庫。為了得到盡可能小的可能網絡庫,找到使可能網絡數量減少最快的實驗路徑顯得格外重要。在確定的模型下,網絡的動力學軌跡由初態决定,囙此選擇不同的初態對縮小網絡庫的範圍非常重要。我們根據網絡初態與動力學軌跡的關係,提出了最大路徑距離、軌跡熵和隨機採樣三種選取網絡初態的方法,用於探索尋找最優動力學軌跡。

最大路徑距離法的基本假設是:狀態i如果距離某條動力學軌跡Ξ越遠,則i演化到該軌跡Ξ的時間越久,演化過程中包含的網絡結構資訊就越多。定義狀態i到軌跡Ξ的距離Di如式(5)。

(5)

式中,dij表示狀態i到Ξ中狀態j的距離,表徵兩狀態間的相似性;Sik是網絡中節點k的狀態。被選取的初態i應該滿足i=argmax(Di)。

軌跡熵法的基本思想是由初態確定的動力學軌跡應該在最大程度上降低網絡的不確定性。從狀態i出發共有k條不同的軌跡,其中有Nij個網絡可產生第j條軌跡Ξj,則網絡從狀態i經過該軌跡Ξj的概率為。定義狀態i的軌跡熵如式(6)。

(6)

式中,軌跡熵Ei表示由狀態i出發演化的不確定性,不確定性越大,從該狀態出發所包含的資訊越多。理論上應該取軌跡熵最大的狀態作為初態,但由於可能網絡的數目龐大,很難用這種方法直接準確計算軌跡熵。囙此,通過引入轉移概率bij並假設其在演化中不變,得到狀態i在第n步軌跡熵的估算反覆運算公式如式(7).

(7)

利用式(7)計算得到Ein的收斂值即為從狀態i出發的軌跡熵Ei

隨機採樣法的基本假設是,在可能網絡庫中隨機抽取一定數量的網絡,如果該採樣網絡集的每條軌跡對應的網絡數分佈與整體網絡的網絡數分佈相似,則該採樣網絡集的最大軌跡熵應該與可能網絡庫的最大軌跡熵一致。囙此,在可能網絡庫中不斷增加隨機抽取的網絡數量並計算該網絡集的軌跡熵,直到軌跡熵收斂為止。

通過提出最大路徑距離、軌跡熵和隨機採樣三種初態選取的方法,我們在三個已知生物調控系統(芽殖酵母細胞週期網絡、裂殖酵母細胞週期網絡和大腸桿菌SOS通路)中類比計算並比較了計算複雜度、剩餘可能網絡數與試驗步數的關係,發現了隨機採樣法的綜合表現最好,最大路徑距離法最差(圖8)。

圖8最大路徑距離、軌跡熵和隨機採樣三種方法在三種生物網絡中的表現

對於可能網絡庫很大的這一問題,雖然隨機採樣的方法在一定程度上縮小了網路拓撲空間,但剩餘網絡數量依舊龐大,需要進一步尋找新的優化策略。已有的研究表明最小網絡是具有特定生物功能且調控邊數最少的網絡,被認為是行使生物功能的骨架網絡。這啟發我們利用最小網絡約束這一條件來進一步减少可能網絡的數量。最小網絡約束的思路是:在隨機採樣的基礎上,先根據目標功能得到每個節點對應的析取範式形式來確定網絡中一定存在的調控邊,然後對餘下所有可能的網絡進行窮舉計算得到最小網絡結構。例如,在設計具有裂殖酵母細胞週期功能的網絡研究中,由動力學軌跡(錶1)可得到節點Cdc2*有邏輯運算式如式(8).

(8)

根據式(8),可以確定具有目標功能的所有網絡一定包含節點Slp1對節點Cdc2*的抑制調控(RSlp1−Cdc2*。運算式(8)的不確定項一共產生了908個可能網絡,通過對這908個網絡窮舉計算,我們得到唯一最小網絡,即,RSlp1−Cdc2*=1,GCdc25−Cdc2*=1其中節點Cdc25對節點Cdc2*的啟動調控是由最小網絡約束得到的。在隨機採樣的基礎上,我們用最小網絡約束的逆向工程方法,通過對具有芽殖酵母細胞週期功能、大腸桿菌SOS功能和裂殖酵母細胞週期功能的網絡進行類比計算,在有限次計算步驟內篩選到了魯棒性高且功能穩定的適量網絡(圖9)。其中,在對具有芽殖酵母細胞週期功能的網路計算時,含有最小網絡約束的逆向工程方法雖然在第一步計算後得到10 884個最小網絡和10條最小網絡公共邊,但在第九步計算後就只剩下了一個最小網絡〔圖9(a)〕,且該最小網絡結構對應於真實的生物調控網絡,證實了最小網絡限制條件的合理性與有效性,進一步優化了逆向工程的過程。上述隨機採樣法和最小網絡約束的兩個理論研究是基於布林網絡的逆向工程指導合成生物學理性設計的雛形。

圖9隨機採樣法和最小網絡約束在不同網絡中的表現

錶1裂殖酵母細胞週期功能的動力學軌跡

在以上基於布林網絡的逆向工程方法的設計中,我們並沒有考慮網絡的魯棒性。因而在功能網絡庫中會存在大量魯棒性不高的網絡結構。為了提高網路設計的成功率,我們需要在基於布林網絡的逆向工程設計中加入生物網絡魯棒性的限制條件來篩選具有高魯棒性的設計網絡。非線性動力學認為系統的魯棒性是功能在系統狀態受外部擾動時的動力學穩定性和功能在系統參數受擾動時的結構穩定性。現時常見的生物網絡動力學穩定性限制包括衡量生物網絡全域狀態穩定性的吸引盆大小和表徵網絡動力學演化軌跡全域吸引性的一維中心流形。除了上述兩種生物網絡動力學穩定性的限制條件外,我們又提出了網絡調控熵的概念,從網絡拓撲結構的角度對生物網絡魯棒性提出了新的限制。普遍認為調控網絡的動力學行為主要由拓撲結構的性質决定。囙此,生物調控網絡的魯棒性應該源於拓撲結構中調控邊的特殊分配。我們從調控網絡的結構特徵出發,提出了衡量網絡拓撲結構與魯棒性關係的調控熵。網絡拓撲結構是調控網絡基於圖論的命名,由若干節點和連接這些節點的所有通路構成。通過定義路徑為拓撲結構中從節點i出發到節點j的任意有向通路,我們得到了從節點i指向節點j的所有路徑集合。定義節點i對節點j的調控熵Sij如式(9)。

(9)

式中,pij中從節點i指向節點j的啟動路徑數占總路徑數的比例。當中沒有啟動路徑或均為啟動路徑時,pij趨向於0或1,對應的調控熵Sij取最小值0,當pij=1/2時,調控熵Sij取最大值1。通過進一步定義節點的調控熵Sj為所有指向節點j的調控熵Sij的平均值,那麼網絡的調控熵S是網絡中各節點的調控熵Sj的平均值。例如,在圖10所示的調控網絡中,各節點的調控熵與該調控網絡的調控熵S如式(10)~式(13)。

(10)

(11)

(12)

(13)

調控熵作為序參量,用於描述網絡調控關係整體耦合的非一致性。顯然,網絡的調控關係越一致,網絡的調控熵越小。

圖10網絡的調控熵的計算示例

通過對具有芽殖酵母細胞週期和裂殖酵母細胞週期功能的生物網絡與相同調控邊的隨機網絡的研究,我們發現了生物網絡的調控熵遠低於絕大部分隨機網絡的調控熵。此外,通過對網絡動力學穩定性和結構穩定性的研究,我們發現了網絡的調控熵越低,對應的吸引盆越大(圖11),且Q值越高(圖12),即網絡的調控熵越低魯棒性越高。為了驗證該理論的普遍性,在四個網絡尺度更大的調控網絡中的計算結果進一步驗證了調控熵與魯棒性的負相關關係。通過引入調控熵這一序參量,建立了網絡拓撲結構與魯棒性之間的聯系,即網絡的調控關係越一致,調控熵越低,對應的網絡魯棒性越高。囙此,在具有複雜功能的網絡結構設計中,調控熵的引入將極大地提高調控網絡的魯棒性,進一步降低複雜網路設計的難度。

圖11網絡調控熵與動力學穩定性的關係

圖12網絡調控熵與結構穩定性的關係

基於上述工作,通過分析系統生物學已有的研究方法,我們又提出了結合布林網絡與連續模型各自優勢的指導理性設計的新思路(圖13):首先,在最小網絡約束的限制下用基於布林網絡的逆向工程方法篩選出具有目標功能的可能網絡庫,然後利用連續模型對其中的每個可能網絡進行詳細的動力學研究與效能評估(圖14)。例如,在對具有SOS響應功能的網絡結構探索中,首先在隨機採樣和最小網絡約束的基礎上,用基於布林網絡的逆向工程方法得到了48個最小網絡與7.1×106個可能的網絡,再用微分方程模型對所有備選網絡進行動力學類比。與網絡窮舉類似,對每個備選網絡進行動力學類比計算時,用Q值和吸引盆大小這兩個名額來定量刻畫網絡結構的魯棒性。從離散模型過渡到連續模型時,布林網絡的粗粒化會使時間尺度與離散閾值的選取不唯一,進而導致離散模型下的一條軌跡對應連續模型下的不同時序軌跡。為了解决這個問題,我們提出了在離散模型和連續模型下的具體限制條件(圖15)。通過連續模型對所有最小網絡的精細刻畫,發現了由離散模型篩選的最小網絡均能實現目標功能且普遍具有較高魯棒性,說明第一步的離散模型幫助我們剔除了大量無關網絡,减小了連續模型的計算量,避免了計算的浪費。此外,對芽殖酵母細胞週期功能的研究結果也證明了我們這種方法指導理性設計的合理性與有效性。這種從離散模型到連續模型的方法不僅可以找到具有特定功能且魯棒性高的網絡結構,還可以幫助我們理解生物網絡的功能設計原理。

圖13從布林網絡模型到連續模型的生物回路設計流程圖

圖14連續模型的定量刻畫與評估流程

圖15在布林網絡模型和連續模型下的三個限制條件

3總結

合成生物學在自下而上的正向工程指導下取得了一定的成功,然而,通過這種思路得到的設計原理是單一的、沒有系統性的,而且這種設計思路忽視的問題在複雜系統的理性設計與實驗實現中變成了主要問題。在系統生物學的幫助下,逆向工程指導合成生物學理性設計的方法,既能獲得具有複雜功能的生物網絡,又能降低回路設計的難度。現時關於逆向工程指導合成生物學理性設計的工作,如網絡窮舉、子網絡合併、基於布林網絡的逆向工程、從離散模型到連續模型的方法等,均表明這種方法的可行性與有效性,為後續的研究提供了有價值的資訊。但是,現時用逆向工程指導合成生物學實驗的研究工作依舊太少,兩者的結合程度還達不到實際的要求程度,需要更多的實驗實例驗證。造成這一現象的主要原因是精准組裝具有複雜調控功能的基因線路的困難。精准組裝指的是用元件獨自表徵時的動力學參數就足够預測元件組裝後的基因線路功能與效能。現時精准組裝調控線路是一個極具挑戰性的工作,即使構建簡單的基因線路也需要耗費大量的時間。而基因線路精准組裝的困難主要來自於:生物系統的元器件存在突變、進化等各種遺傳穩定性問題、生物元器件組裝後在宿主細胞中的相互作用對目標功能的影響、構建的外源複雜基因回路與宿主細胞的相互影響等問題。雖然在精准組裝方面已有初步研究進展,但是現時精准組裝基因線路的難度依舊很大,有待我們進一步研究,從而更加方便地構建具有複雜功能的調控回路。我們相信,在突破逆向工程在合成生物學中實際應用的瓶頸後,在逆向工程的指導下,合成生物學的理性設計很快可以投入到具體的應用生產中。

原文刊載於《合成生物學》期刊

本文版權歸原作者所有,文章內容不代表平臺觀點或立場。如有關於文章內容、版權或其他問題請與我方聯系,我方將在核實情况後對相關內容做删除或保留處理!

本文標題: 生物逆向工程設計在合成生物學中的應用
永久網址: https://www.laoziliao.net/doc/1656051430823834
相关資料
重大物理學院郭恒宇老師課題組在Advanced,Materials上發表成果
在微流控系統中微流泵是其覈心元件,用於驅動和控制微流液體在晶片中工作,囙此顯示出重大的意義。此外,高壓電源體積大、成本高、不安全,會在電極附近形成氣泡並產生焦耳熱,從而影響微流效率。
標籤: 納米 科普
地理所成昇魁研究團隊在Nature,Food發表中國食物供應鏈損失和浪費及其資源環境影響最新成果
食物損失和浪費與糧食安全、食物安全、營養健康、資源環境以及經濟社會等密切相關,被認為是全球食物系統可持續發展的重要阻礙。對於食物損失和浪費現狀的定量刻畫是分析其資源環境影響、製定减少目標以及製定減緩對策的重要基礎。
標籤: 資源浪費 中國資源 nature
華南植物園“一種利用三白草淨化富營養化水體的方法”獲發明專利
7月19日獲悉,由中科院華南植物園王發國等完成的“一種利用三白草淨化富營養化水體的方法”獲國家發明專利授權。該方法包括以下步驟:1)選取三白草地下莖或三白草地上莖;2)將三白草莖段水准置於富營養化水體中,使其在水面上漂浮生長;3)用竹竿固定
標籤: 三白草 水體富營養化