成都生物所開發一種從動物全基因組數據中選取並組裝線粒體全基因組的方法

而線粒體基因組相比於線粒體DNA片段,包含更豐富的遺傳資訊且不易受到自然選擇的影響,是一種重要的分子標記。圖1MEANGS利用動物全基因組數據組裝線粒體基因組的工作流程。

線粒體DNA因具有母系遺傳、跨階元保守以及較快的進化速率等特點,被廣泛應用於進化生物學,生物多樣性及臨床醫學的相關研究中。而線粒體基因組相比於線粒體DNA片段,包含更豐富的遺傳資訊且不易受到自然選擇的影響,是一種重要的分子標記。

數年前,若要獲取一個完整的線粒體基因組,通常要使用噬菌體尅隆的方法。在一代測序普及後,獲取完整線粒體基因組則通常需要使用引子步移(primer-walking)PCR的方法。但這兩種方法都非常耗時且成本較高。近年來,隨著測序科技的快速發展,動物(尤其是非模式動物)全基因組數據(WGS)獲取變得簡單、便宜;這使得資料庫中全基因組數據量呈指數態勢增長。全基因組測序數據往往同時包含線粒體序列和核基因序列,通過生物資訊學的方法從中選取並組裝完整的線粒體基因組,是非常好的科技手段。雖然已有部分學者開發了一些生物資訊學軟件用以實現此目的,但是,其大都具有自身的局限性,包括需要人工提供參攷序列(“種子”)、數據相容性差、準確率低等難點,未能高效、準確、便捷地完成相關任務。

為克服這一難點,提升研究人員的工作效率,中國科學院成都生物研究所李家堂課題組開發了一種不依賴“種子”序列從動物全基因組數據中選取並組裝線粒體全基因組的方法,並使用Python及C++編寫為軟件——MEANGS。MEANGS工作流程比較簡單,極大地提升了研究人員的可操作性。首先,利用預置的線粒體模塊資料庫,MEANGS使用nhmmer根據線粒體序列特徵對輸入的二代數據進行預篩選並獲取潜在的線粒體編碼reads;獲得潜在的線粒體編碼reads後,MEANGS利用線性反覆運算算灋(SSAKE)(C++改寫)組裝模塊對reads進行組裝獲取線粒體編碼contigs;相關contigs經由nhmmer進行二次篩選,非冗餘線粒體編碼contigs將被選擇作為“種子”序列用於全線粒體基因組的組裝;最後利用“種子”序列,MEANGS再次使用組裝模塊以“種子”contigs為基礎,組裝完整的線粒體基因組。另外,針對組裝好的線粒體基因組,MEANGS可對編碼基因進行輔助注釋。

圖1 MEANGS利用動物全基因組數據組裝線粒體基因組的工作流程。

針對MEANGS,本研究使用了來自不同類群(哺乳類、鳥類、魚類、爬行類、兩栖類,昆蟲和軟體動物),不同測序質量的16組數據來進行相關測試。同時,本研究選取了其他三款同類型軟件(norgal,NOVOPlasty,MitoZ)進行同條件測試,並基於常規的評估標準(運行時長、記憶體使用、準確性、完整性、完成數量等)對軟件的表現進行評估。測試及比較結果表明,MEANGS數據相容性最好,完成了所有測試數據的測試,而其他三款軟件均有失敗案例。在常規的評估名額上,MEANGS表現出最優的整體效能,除了在記憶體使用上稍遜色於norgal,其餘表現均優於其他軟體。MEANGS的開發有利於研究人員開展相關工作,推動相關學科的高品質快速發展。

圖2 MEANGS與其他三款軟件相比表現出最好的數據相容性。

圖3 MEANGS與其他三款軟件在常規評估名額上顯示出明顯優勢。

該研究成果以MEANGS: an efficient seed-free tool forde novoassembling animal mitochondrial genome using whole genome NGS data為題,已在生物資訊學國際頂級期刊Briefings in Bioinformatics(IF: 11.62)線上發表。中國科學院成都生物研究所在讀博士研究生宋夢洹,特別研究助理嚴超超博士為論文的共同第一作者,李家堂研究員為論文的通訊作者。本研究得到成都生物研究所高級工程師蔣海波博士和碩士生桂承波的大力幫助。本研究得到中國科學院B類先導科技專項、科技部第二次青藏高原綜合科學考察研究專案、中國科學院對外合作重點專案、中國科學院西部之光交叉團隊項目、中國科學院前沿科學重點研究專案及四川省傑出青年科技人才項目等項目的資助。

原文連結

本文標題: 成都生物所開發一種從動物全基因組數據中選取並組裝線粒體全基因組的方法
永久網址: https://www.laoziliao.net/doc/1656033725576420
相关資料
电浆所在EAST芯部重雜質的輸運及其對电浆效能影響的類比研究方面取得重要進展
电浆所與科大核學院聯合培養的博士生石生宇在集成類比EAST芯部重雜質的輸運及其對电浆效能影響的研究中取得重要進展。相關一系列成果近期發表在NuclearFusion期刊上。最近,电浆所博士生石生宇在多通道集成預測類比帶有溫度、密度和環向旋轉
標籤: 科學 科普 电浆
中國人大物理系及合作團隊發現宏觀鐵磁性資料在二維極限下的本征反鐵磁序
近日,中國人民大學物理學系王聰博士、季威教授等人與華中科技大學付英雙教授等多個實驗團隊通力合作,研究了一種宏觀呈現出鐵磁性的層狀資料CrTe2。理論預測結合實驗量測共同證實了CrTe2在其二維極限下(單層中)出人意料地呈現出本征反鐵磁序,並
標籤: 鐵磁性 電子自旋 二維 二維資料 科學 自旋
上科大信息學院江智浩團隊在人-機-物三元融合系統領域取得多項進展
智慧軟件如何利用其嚴謹性以及高算力承擔人類專家不擅長的工作,並為領域專家提供具有可解釋性的輔助是人-機-物三元融合系統的覈心問題。上科大信息學院江智浩團隊利用形式化方法保證智慧軟件的正確性,並使用數位孿生科技集成領域知識,保證輔助的可解釋性
標籤: 三元 軟件
Nature,過午不食,延年益壽,最高可延長壽命達18%!
衰老和死亡是人類永恒的話題,古往今來,多少追求長生的故事都以失敗告終,直到近幾十年我們才逐漸撥開衰老的面紗,從認識衰老到逆轉衰老、延長壽命,變不可能為可能。近期,來自美國哥倫比亞大學的MimiShirasu-Hiza團隊發現了一種限時進食方
標籤: 過午不食 自噬 nature 果蠅 生物鐘