近日,南方科技大學生命科學學院副教授翟繼先課題組使用基於Nanopore三代測序平臺的Pore-C科技,解析了擬南芥基因組多位點相互作用及關聯甲基化修飾,相關成果以“Pore-C Simultaneously Captures Genome-wide Multi-way Chromatin Interaction and Associated DNA Methylation Status in Arabidopsis”為題發表在國際知名學術期刊Plant Biotechnology Journal。
染色質捕獲科技(Chromosome conformation capture)通過對染色質進行酶切和鄰近連接得到的嵌合體序列進行測序,獲得染色質互作資訊,解析基因組的三維結構。其中,Hi-C和ChIA-PET科技在植物中的應用,為我們提供了豐富的植物基因組結構資訊,解析了包括擬南芥、水稻、蕃茄、玉米等在內的多種植物的染色體互作圖譜。然而,由於二代測序讀長的限制以及其雙端測序的特點,Hi-C和ChIA-PET科技只能提供染色體位點兩兩互作的資訊(two-way interaction),而染色質多位點之間的互作資訊(multi-way interaction)只能由多個細胞的兩位點互作資訊推理得出。由於細胞間的異質性,這種推論並不準確。另外,Hi-C和ChIA-PET科技包括了PCR擴增步驟,也無法保留序列上的錶觀修飾資訊。其他捕獲染色質多位點互作的科技,如SPRITE和ChIA-Drop,操作難度較大,難以在植物中應用推廣。
Nanopore測序科技是一種長讀長、單分子的測序科技。通過對過孔電流訊號的解析,Nanopore可以讀出平均長達30kb的堿基序列資訊,並獲得DNA分子上包括m5C,hm5C,and m6A在內的錶觀修飾資訊。2019年,Ulahannan等人開發了Pore-C科技,使用Nanopore對染色質酶切、連接後形成的多片段嵌合體序列進行長讀段測序,成功解析了哺乳動物細胞中的染色質多位點互作情况。
本研究在擬南芥中應用Pore-C科技,首次對植物基因組的多位點互作情况進行解析。相比起Hi-C實驗流程,Pore-C的實驗流程無需生物素標記、片段化、親和純化、DNA片段純化等步驟,大大簡化了實驗操作步驟,建庫流程可以在三天內完成(圖1A)。研究人員使用擬南芥野生型幼苗構建了兩個Pore-C文庫,分別獲得6.5 million(11.7Gb)和3.5 million(7.9Gb)高品質讀段,N50長度分別為2654bp和3006bp。從這些文庫中一共拆出50.7 million有效的成對互作。對比Hi-C文庫,獲得相當成對互作數量所需要的Pore-C測序讀段數和測序堿基量都更少,證明Pore-C檢測基因組互作的效率更高。此外,Pore-C的兩個文庫之間,以及Pore-C和Hi-C數據在檢測擬南芥基因組互作時也有良好的一致性,說明該科技的可重複性和準確性較好(圖1B,1C)。在擬南芥中,有44%的Pore-C讀段能檢測到多個基因組片段(圖1D),和人細胞中Pore-C多位點互作讀段比例相近(47%),對多位點互作的檢測效率高於SPRITE科技。含基因組片段數越多的Pore-C片段,可以檢測到更遠基因組距離上的互作,這一特徵有助於輔助基因組拼接(圖1E)。
Pore-C在擬南芥中的應用,印證了在擬南芥基因組中存在多個KNOT ENGAGED ELEMENT(KEE)之間互作的推測。有超過1145條Pore-C讀段檢測到三個KEE之間的互作,並通過了統計學檢驗。其中,有一半的KEE多位點互作都和KEE3與KEE4相關聯,說明KEE3和KEE4可能是KEE高維互作的覈心區域(圖1F)。另外,還有多條Pore-C讀段檢測到了4個KEE之間的互作(圖1G)。Pore-C科技也檢測到了擬南芥中多個端粒之間的互作,該現象也與之前Hi-C數據所推導出的結論相符。
本研究還解析了Pore-C數據中的甲基化修飾資訊。研究人員使用甲基化修飾分析工具Deepsignal-plant解析了Pore-C片段中的CG,CHG,CHH的分布情况,得到的甲基化修飾訊號與傳統的全基因組亞硫酸氫鹽測序(Whole genome bisulfite sequencing,WGBS)檢測結果高度一致(圖1H)。研究人員還使用Nanopolish解析了與互作資訊關聯的CG甲基化,發現空間距離較近的互作片段之間存在較高的甲基化水准關聯性,這一規律與2019年任兵團隊使用Methyl-HiC科技在小鼠胚胎幹細胞(mESC)發現的規律相近(圖1I)。
圖1 Pore-C捕獲擬南芥基因組的多位點互作及DNA關聯甲基化資訊
A:Pore-C實驗流程示意圖;B,C:Pore-C兩個文庫之間(B)以及Hi-C和Pore-C之間(C)互作矩陣比較;D:擬南芥Hi-C和Pore-C數據中單條讀段上的互作DNA片段數(Contact Order)的分佈比較;E:不同Contact Order組別的Pore-C讀段中,互作頻率在基因組距離上的分佈;F:檢測到至少三個不同KEE元件的Pore-C讀段中的KEE組合分佈;G:與KEE3,KEE4,KEE7,KEE8關聯的Pore-C讀段比對位置分佈;H:Pore-C檢測到的CG、CHG、CHH DNA甲基化和WGBS甲基化結果比較;I:基因組距離25kb,100kb,1Mb的Pore-C互作片段之間CG甲基化水准的皮爾森相關係數(PCC)。
翟繼先課題組博士研究生李卓雯、研究助理教授龍豔萍為共同第一作者,翟繼先為該論文的通訊作者,南科大是論文第一單比特。翟繼先課題組博士研究生於義溟、劉智劍、莫偉鵬,碩士研究生張洪,研究助理教授賈津布也參與了本研究的部分工作;南科大生物系助理教授鄭梅珍、研究助理教授田忠原指導了該研究。該研究得到了國家重點研發計畫,廣東省創新創業團隊和深圳市科創委等項目的資助。
論文連結:https://onlinelibrary.wiley.com/doi/full/10.1111/pbi.13811