單細胞全基因組測序科技(scWGS)可以有效揭示生物樣品中不同細胞之間的異質性,並系統鑒定單個細胞的基因組中發生的遺傳變化,例如拷貝數變異(CNV)和點突變(單核苷酸變異,SNV)等。過去十年,研究人員已經開發出多種單細胞基因組擴增科技,例如簡並寡核苷酸引子PCR擴增科技(DOP-PCR)、多重置換擴增科技(MDA)、多重退火和基於環的擴增迴圈科技(MALBAC),以及通過轉座子插入和體外轉錄進行線性擴增科技(LIANTI)等。但是,現時的單細胞全基因組測序科技均基於二代測序(NGS)平臺,該平臺檢測準確度高,但是測序讀長相對較短(通常只有150bpX2),主要適用於檢測單個細胞中的單核苷酸變異(SNV)、小的插入缺失(<50bp,Indel)以及拷貝數變異(CNV)等。由於二代測序平臺讀長的限制,對於基因組中結構變異的檢測具有很大的局限性。結構變異(包括插入、缺失、重複和易位等)是人類體細胞遺傳變異的主要來源之一,對腫瘤的發生、發展和轉移具有潜在的驅動作用,然而現時在單個細胞水准對基因組結構變異的研究卻鮮有報導。
論文截圖
針對基於二代測序平臺的單細胞基因組測序科技難以高效鑒定單個細胞中結構變異這一世界難題,2021年6月30日,北京未來基因診斷高精尖創新中心、北京大學生物醫學前沿創新中心湯富酬課題組在Genome Biology上線上發表了題為“SMOOTH-seq: single-cell genome sequencing of human cells on athird-generation sequencing platform”的研究論文,在國際上率先開發了基於三代測序(單分子測序)平臺的單細胞基因組測序科技。
該研究的主要突破有:
開發了一種高精度的基於三代測序(單分子測序)平臺的單細胞基因組測序方法——SMOOTH-seq(Single-MOlecule real-time sequencing of LOng Fragments amplified THrough Transposon insertion)。使用優化後的Tn5轉座反應,SMOOTH-seq能够從單個細胞中擴增出平均長度約6kb的基因組片段(測序讀長比單細胞基因組二代測序科技長了20倍左右),通過引入與單分子測序平臺相容的細胞條碼使單細胞基因組DNA擴增子適用於Pacbio sequel II平臺的HiFi測序模式。測序後的數據中,產生的環化測序(circular consensus sequencing,CCS)的讀長平均在6kb左右,最長可達43kb。(如圖1所示)。
圖1.SMOOTH-seq的流程和評估
該研究開發的SMOOTH-seq方法能够在單個細胞中高效檢測基因組結構變異。在單個K562細胞中,當測序深度僅為0.4X時,基因組覆蓋度可達19%。該研究對91個單細胞進行SMOOTH-seq分析,從中檢測到4790個缺失事件和5589個插入事件,其中87%的缺失片段和91%的插入片段長度小於1kb,檢測到的插入事件DNA片段最長達到7.7kb。同時,該研究也在K562細胞中檢測到521個易位事件,包括準確檢測到兩對經典融合基因:BCR-ABL和NUP214-XKR3。SMOOTH-seq科技對結構變異的檢測精度高,當使用K562大量細胞的基因組三代測序結果作為比較基準時,該研究中使用的K562細胞系的每個單細胞中的結構變異檢測平均精確度為75%,特別是在單個細胞中檢測插入事件平均精確度為85%。此外,SMOOTH-seq也可以以1Mb的分辯率準確檢測到兩個K562尅隆之間的不同拷貝數變異(CNV)事件。(如圖2所示)
圖2.單個K562細胞中CNV及結構變異檢測的精確度
該研究開發的SMOOTH-seq方法能够在單個細胞中高效檢測染色體外環形DNA(ecDNA)。已有的研究報導表明,染色體外環形DNA在腫瘤發生中比較常見,且致癌基因能够在染色體外環形DNA中進行大量擴增,促進腫瘤發生和轉移。SMOOTH-seq科技產生的長讀長數據,使其能够被用於在單個細胞中精准捕獲小於10kb的全長染色體外環形DNA。本研究同時開發了用於鑒定K562細胞系中的染色體外環形DNA的生物資訊學分析方法。當僅有一個拷貝的Tn5轉座酶與一個染色體外環形DNA分子結合時,整個環形DNA分子就可被完整擴增為一個線性片段,即單個讀段即可覆蓋一個染色體外環形DNA分子的全長序列。通過統計Tn5插入位置不同但長度完全相同的一組讀段,即可判斷它們是否來源於同一個環形DNA。同時該特徵可用於幫助精准區分染色體外環形DNA和串聯重複序列(如圖3所示)。
圖3.SMOOTH-seq精准檢測染色體外環形DNA的示意圖
該研究開發的SMOOTH-seq方法能以較高準確度檢測基因點突變(SNV)。由於三代測序平臺本身的局限性,使用SMOOTH-seq方法在單個細胞中檢測SNV的假陽性率為2.0×10-5。(如圖4所示)
圖4.SMOOTH-seq檢測單細胞K562中SNV的假陽性率
該研究開發的SMOOTH-seq方法可以在結直腸癌腫瘤樣本中準確檢測出各種基因組結構變異事件。在對患者結直腸癌腫瘤樣本的分析中,以在結直腸癌的至少2個單細胞中同時檢測到為標準,該研究檢測出8594個結構變異事件(4089個插入事件,3852個缺失事件,341個易位事件,以及312個重複事件)。通過將結直腸癌腫瘤樣本和K562細胞系中共有的結構變異去除後,該研究共得到3570個結直腸癌腫瘤細胞特异性的結構變異事件(1376插入事件,1661缺失事件,230易位事件以及303重複事件)。同時,該研究通過設定多個對照基因組(包括相應的腫瘤組織、與腫瘤相鄰的正常組織、GM12878細胞系和另一個體的外周血單核細胞的基因組)對檢測出的結構變異事件進行了PCR驗證。此外,該研究發現結直腸癌腫瘤樣本和K562細胞系中共有的結構變異在所有被檢測的多個人類基因組DNA樣品中均存在,說明這些結構變異事件實際上是由於當前的人類參攷基因組不够完善,缺失了部分關鍵序列資訊引起的。今後三代測序將有助於組裝出更完整精准的人類參攷基因組序列。(如圖5所示)
圖5.PCR驗證基因組結構變異的結果
綜上,該研究開發的單細胞基因組單分子測序科技(SMOOTH-seq),將長讀長的三代測序科技巧妙運用到了單細胞基因組測序上,能够實現對於基因組結構變異、染色體外環形DNA等多種分子事件的高精度檢測,大大提高了單細胞基因組測序科技的適用範圍,具有廣闊的應用前景。該研究開創了單細胞基因組單分子測序時代,該研究開發的單細胞基因組單分子測序科技將揭開更多的人類基因組中的“暗物質”的奧秘,給人類生物醫學研究帶來全新的發展機遇。
生物島實驗室研究員範小英、北京大學楊成博士以及北京大學前沿交叉學科研究院博士生李文為該論文的並列第一作者。北京未來基因診斷高精尖創新中心、北京大學生物醫學前沿創新中心湯富酬教授為該論文的通訊作者。該研究專案得到了國家自然科學基金委、北京市科技委和北京未來基因診斷高精尖創新中心的支持。
本文版權歸原作者所有,文章內容不代表平臺觀點或立場。如有關於文章內容、版權或其他問題請與我方聯系,我方將在核實情况後對相關內容做删除或保留處理!