北京大學張澤民課題組發表單細胞數據綜合新方法

利用單細胞RNA測序科技產生可靠新發現的重要途徑是綜合多來源的數据集。現時的主流批次效應消除方法都很難在兩者之間做到可靠的平衡。張澤民實驗室博士後王東方等開發了一種新的方法iMAP,為單細胞數據的有效整合提供了新的思路。

2月18日,北京大學生物醫學前沿創新中心(BIOPIC)、生命科學學院、北京未來基因診斷高精尖創新中心(ICG)、生命科學聯合中心(CLS)張澤民實驗室聯合百奧智匯在期刊Genome Biology上發表了題為“iMAP: integration of multiple single-cell datasets by adversarial paired transfer networks”的生物資訊方法學論文,提出了基於深度自編碼器和生成式對抗神經網路的單細胞數據綜合的新方法iMAP。

利用單細胞RNA測序科技產生可靠新發現的重要途徑是綜合多來源的數据集。然而,不同批次實驗產生的數据集之間存在不可避免的科技差异,消除這些科技差异而保留不同實驗之間真實存在的生物學差异,是開發批量效應消除方法的主要挑戰。現時的主流批次效應消除方法都很難在兩者之間做到可靠的平衡。

張澤民實驗室博士後王東方等開發了一種新的方法iMAP,為單細胞數據的有效整合提供了新的思路。他們開發的iMAP方法結合了現時兩種最先進的無監督深度網絡結構—深度自編碼器和生成式對抗神經網路(GAN)的優勢。GAN的主要作用在於能够準確地將不同數据集、相同細胞類型的細胞的基因表達分佈進行混合,然而真實生物數据集的細胞組成十分複雜,可能存在不完全重合的細胞類型,相同細胞類型在不同數據集中的分佈比例也可能存在很大差异。囙此,iMAP首先構建了一種新的自編碼器結構來選取細胞的低維表示特徵,該特徵能够一定程度上消弭批次效應的影響,同時保留不同數据集之間真實存在的生物學差异,進而通過構建rwMNN細胞對,形成有效的自訓練數據指導後續GAN網絡進行正確的細胞基因表達分佈混合。與其他方法相比,iMAP既能匹配不同批次數據集中相同類型的細胞的基因表達分佈,又能識別各個數据集上特定的細胞類型。他們在十多個不同規模、不同測序科技產生的數据集上論證了iMAP方法的有效性與可靠性。與其他基於深度學習的方法相比,iMAP在大規模數据集上具有顯著的速度優勢。他們也將iMAP應用於腫瘤浸潤免疫細胞數据集的分析,通過綜合分別由Smart-seq2和10x Genomics科技產生的數据集發現了腫瘤微環境中新的細胞間相互作用。

iMAP算灋的基本框架

iMAP提供了免費Python套裝軟體(https://github.com/Svvord/iMAP),可供用戶實現單細胞轉錄組數據綜合。隨著單細胞測序科技的廣泛普及應用以及大量的大規模數据集的產生,iMAP可能成為綜合不同批次實驗產生的數據的有利工具,並為後續算灋的開發提供新的思路。

北京大學BIOPIC/生命科學學院博士後王東方和清華大學博士生侯思宇為該論文的共同第一作者,王東方和BIOPIC/生命科學學院張澤民教授為該論文的通訊作者。該課題得到了國家自然科學基金委、北京未來基因診斷高精尖創新中心及北京百奧智匯的資助。

本文轉載於北京大學新聞網(https://news.pku.edu.cn/index.htm),版權歸原作者所有,文章內容不代表平臺觀點或立場。如有關於文章內容、版權或其他問題請與我方聯系,我方將在核實情况後對相關內容做删除或保留處理!聯繫郵箱:yzhao@koushare.com

本文標題: 北京大學張澤民課題組發表單細胞數據綜合新方法
永久網址: https://www.laoziliao.net/doc/1656066953401474
相关資料
中南大學謝輝團隊發文揭示一種新型“腸-骨軸”骨代謝調控模式
骨質疏鬆症性骨折輕則影響機體功能,重則致殘甚至致死。該研究探明了兒童腸道菌群及其富含的益生菌Akkermansiamuciniphila的骨保護功效,並揭示了一種由腸道菌功能性EVs介導的新型“腸-骨軸”骨代謝調控模式,為骨質疏鬆症的防治提
標籤: 骨質疏鬆症 謝輝 益生菌
中國科大成功構築無機“圖靈結構”催化介面
1952年,計算機科學與人工智慧之父圖靈提出:某些重複的自然圖案可能是由兩種特定物質通過“反應-擴散”的過程相互作用產生。“圖靈結構”在自然界中廣泛存在。近日,中國科學技術大學高敏銳教授研究組利用“反應-擴散”的機制,首次實現了在無機過渡金
標籤: 圖靈 科學 科普
地環所在黃土高原人工林地和自然草地的土壤水—植物水同位素分析方面取得新進展
自1950年以來,黃土高原實施了一系列的植被恢復工程,其中自然草地恢復和人工造林恢復是黃土高原生態治理最重要的兩種植被恢復模式。該研究有助於深入理解黃土高原兩種不同植被恢復模式下水文迴圈的差异。
標籤: 植物 黃土高原
深圳先進院等在超導物理領域取得重要進展
2015年,Nature刊文報導在硫化氫中發現了超過200K的超導轉變溫度,2018年LaH10創造了260K的超導臨界溫度記錄。隨後,理論研究預測,不同於含有S-H極性共價鍵的硫化氫,在含有氫團簇的金屬氫化物中同樣可以實現超過200K的超
標籤: 深圳 超導體 科普 電子 科技新聞