北京基因組所(國家生物資訊中心)針對我國基因組數據“存管用”的實際需求,幾年來,共建立了55個資料庫,涉及衰老、疾病、調控和生物多樣性等多個前沿領域,初步形成了我國生物數據安全匯交管理和多組學數據平臺的國家中心數據資源體系。基因組序列和注釋是基因組相關研究的重要資源,中國作為世界上生物多樣性最豐富的國家之一,在過去幾十年中,已經對大量重要國家戰畧資源物種的基因組進行測序和組裝。為解决科研人員匯交數據過程中遇到的難題,滿足國內外用戶迅速增長的基因組數據匯交、管理和共亯需求,北京基因組所開發了基因組資料庫Genome Warehouse(GWH)。
GWH是一個存儲各物種基因組組裝數據的公共資源庫,為基因組數據匯交、存儲、發佈和共亯提供一系列web服務。GWH接受具有不同組裝水准的全基因組和部分基因組(葉綠體、線粒體和質粒等)序列,以及對已有基因組數據的更新。除了基因組序列和注釋外,GWH還收集了生物項目、生物樣本和基因組組裝相關中繼資料的詳細資訊。為收集高品質的基因組序列和注釋資訊,GWH配備了統一和標準化的品質控制程式。除基本的瀏覽和搜索功能外,所有發佈的基因組序列和注釋均可以通過JBrowse進行視覺化。
2021年6月24日,GWH相關研究成果以“Genome Warehouse: A Public Repository Housing Genome-scale Data”為題線上發表於學術期刊《基因組蛋白質組與生物信息學報》(Genomics,Proteomics & Bioinformatics)。
截至2021年7月1日,GWH已收到19769個匯交的基因組組裝數據,涵蓋1196個物種,並已發佈其中的9353個。GWH發佈的基因組數據已經在47個期刊的近百篇文章中發表。此外,GWH還與美國國家生物技術資訊中心(National Center for Biotechnology Information,NCBI)建立了資料共用交換機制,提升了數據的國際影響力。
此項工作得到了中國科學院戰略性先導科技專項、國家重點研發計畫、中國科學院“十三五”信息化專項等項目的資助。
論文連結
截至2021年7月1日GWH收錄的基因組組裝資料統計
本文版權歸原作者所有,文章內容不代表平臺觀點或立場。如有關於文章內容、版權或其他問題請與我方聯系,我方將在核實情况後對相關內容做删除或保留處理!