2月8日,華中農業大學生物資訊團隊楊慶勇教授課題組在國際學術期刊Molecular Plant線上發表題為“BnVIR: bridging the genotype-phenotype gap to accelerate mining of candidate variations for traits in Brassica napus”的研究論文,該研究建立了甘藍型油菜基因型與基因表達、錶型的關聯,為快速、高效地挖掘油菜候選變異/基因提供了平臺。
該研究首先構建了一套由2311個甘藍型油菜覈心種質鑒定的10090561個遺傳變異的數据集,其中包括SNP、InDel和不同種類的SV,這是現時已發表的最為系統、最為完整的甘藍型油菜遺傳變異集合。該研究以其中1703個資料的18個性狀的錶型數據和309個資料的RNA-seq數據為基礎,構建出甘藍型油菜變異資訊資源資料庫BnVIR(http://yanglab.hzau.edu.cn/BnVIR)(圖1)。
圖1 BnVIR資料庫主頁、構建流程和概貌
該資料庫提供了群體水准的遺傳變異基因型與錶型和基因表達量的關聯,可輔助快速挖掘與油菜性狀相關的候選變異和基因(圖2)。此外,該資料庫為甘藍型油菜種質資源的査詢、群體遺傳學和進化分析以及關聯分析等提供了多種工具。最後,該研究通過挖掘一些已報導的(如FLC.A10、FAE1.A08、FAE1.C03、FAD2.A05)和新鑒定的候選基因和功能變異的案例分析,以及獨立錶型數据集的檢驗分析等系列工作,系統全面地展示了該數據平臺在挖掘與錶型相關的候選變異和基因的潜力、可靠性與穩健性(圖3)。與現有甘藍型油菜資料庫不同,BnVIR提供了更加全面、更加豐富的變異及其與多個組學數據的關聯和更加友好和豐富的使用者介面,可顯著提高研究者挖掘候選變異和基因的效率,並為甘藍型油菜的分子育種開發提供有價值的標記。
圖2使用BnVIR資料庫驗證/挖掘候選基因/變異的實例
遺傳變異是物種錶型多樣性形成的物質基礎,包括單核苷酸多態性(SNP),小片段的插入/缺失(InDel)以及大規模結構變異(SV)。現時,遺傳變異已被廣泛應用於人類疾病、動植物重要農藝或經濟性狀相關遺傳位點的鑒定、重要功能基因的尅隆、分子標記輔助選擇育種等工作。對於作物遺傳育種,準確瞭解遺傳變異對基因的調控效應以及與錶型分化的關聯,對種質資源的精准鑒定和優异等位基因的挖掘具有重要作用。
油菜作為世界四大油料作物之一,在全球範圍內為人類的生活和生產提供優質的食用植物油和飼料蛋白來源。我國年均油菜生產和消費居世界首位,常年種植面積1億畝左右,占油料作物面積的50%以上,油菜安全生產在保障我國食用油供應和蛋白飼料需求上發揮著重要作用。近年來,經過一代又一代油菜科學家的努力,我國油菜研究實現了從理論、科技、產品到轉化的鏈式創新,推動了我國油菜基礎研究與應用步入世界第一方陣(《中國農業農村科技發展報告(2012—2017)》)。然而,當前我國油菜大多仍以常規育種與分子標記輔助選擇育種科技為主,與國外大規模應用的以基因組選擇為覈心的分子育種科技相比,在品種育成速度、成功率及效率等方面仍有較大差距。囙此,如何將基礎研究中長期積累的資源和多組學數據(基因組、轉錄組等)優勢轉化成育種優勢,是當前油菜遺傳育種的覈心研究內容之一。
隨著後基因組代的到來,作物科學領域已積累海量數據,利用生物資訊技術將大規模的多組學數據進行系統的綜合和分析,並構建更友好的圖形化、視覺化資料庫,將極大促進重要農藝性狀的功能基因的發掘及機制解析,推動優异種質資源的開發和利用,加快品種選育。這對發展高效、精准的新一代生物育種,打贏種業翻身仗具有重要意義。該研究不僅為甘藍型油菜今後的遺傳育種提供了重要平臺,也為其他作物進行綜合和利用多組學數據推動育種產業發展提供重要參攷。
華中農業大學信息學院楊慶勇教授為論文通訊作者,信息學院已畢業博士生楊植全(現廣州大學博士後)、博士研究生梁聰園和碩士研究生魏璐露為論文共同第一作者。華中農業大學作物遺傳改良國家重點實驗室周永明教授、郭亮教授對本研究提供了重要指導。該研究得到國家自然科學基金、國家重點研究發展計畫和中央高校基本科研業務費專項資金專案資助。
楊慶勇教授課題組近年來聚焦“油菜基因組學與分子育種”研究方向,先後與國內多個研究團隊合作,通過系統綜合和分析甘藍型油菜的多組學數據,構建了首個油菜泛基因組(Nature Plants,2020)及其資料庫BnPIR(Plant Biotechnology Journal,2021)、油菜轉錄組資料庫BnTIR(Plant Biotechnology Journal,2021)、油菜遺傳變異資料庫BnVIR(Molecular Plant,2022)和植物遺傳變異參攷面板資料庫Plant-ImputeDB(Nucleic Acids Research,2021),搭建了我國自主可控的油菜參攷基因組生態。現時在Molecular Plant、Nature Plants、Nucleic Acids Research、Plant Biotechnology Journal等雜誌發表多篇油菜基因組和資料庫論文。
【英文摘要】
Genetic variations,which range from single nucleotide polymorphisms(SNPs)and short insertion/deletions(InDels)to large-scale structural variations(SVs),are the basis of phenotypic diversity.Understanding the effect of genetic variations on traits is critical for uncovering the genetic architecture of various phenotypes.In humans,great efforts have been made to catalog the huge amounts of variations in single locus and their functional and phenotypic impacts,as well as detect the genetic interactions between loci underlying complex diseases,which are of great significance for pathologic studies(Civelek and Lusis 2014;Karczewski et al.,2020;Li et al.,2013).In plants,the functional and phenotypic impacts of genetic variations remain largely unknown.As an important oil crop,Brassica napus(B. napus)provides high-quality vegetable oil and feed protein worldwide(Chalhoub et al.,2014).Substantial genotypic,transcriptomic and phenotypic data of B. napus have become available in public databases recently(Liu et al.,2021;Song et al.,2020;Yan et al.,2021),which provide important resources for molecular marker-assisted breeding and genetic improvement of B. napus.However,the mining of candidate variations/genes has been largely hindered by the lack of solid association between genotype and phenotype and the corresponding platform(Yan et al.,2021).Here,to bridge the gap between genotype and phenotype,we first constructed a large panel of genetic variations,and presented the most systematic and complete variations of B. napus,including SNPs,InDels and various SVs.Then,phenotype data from traits of 1703 accessions and RNA-seq data of 309 accessions were used as a basis to assemble a B. napus variation information resource(BnVIR;http://yanglab.hzau.edu.cn/BnVIR).The database provides genotype-phenotype maps for rapid mining of candidate variations/genes associated with various traits in B. napus.Besides,it is the first platform for checking the genetic interactions between candidate loci or genes associated with quantitative traits.
論文連結:https://www.cell.com/molecular-plant/fulltext/S1674205222000508