近日,上海科技大學iHuman研究所水雯箐課題組與信息學院何旭明課題組合作在Nature Communications期刊發表了題為“DeepPhospho accelerates DIA phosphoproteome profiling throughin silicolibrary generation”的研究論文,探索利用新型深度神經網路挖掘蛋白質組數據。該工作創建了DeepPhospho譜圖預測模型,並為數據非依賴型(DIA)磷酸化蛋白質組的數據解析提供了一套新流程。該流程能够大幅提升對細胞內磷酸化蛋白質及其修飾位點的鑒定數目,同時保證位點鑒定和磷酸化水准定量的高準確度和可重複性。利用該流程對同一套組學數據進行重新挖掘,相比於常規的生物資訊學流程能够發現更多的細胞生長因數介導的訊號通路和調控的下游激酶。
蛋白質磷酸化是最常見和功能最重要的一種翻譯後修飾,幾乎所有的細胞訊號通路都受到磷酸化修飾的精密調控。近年來,基於質譜的磷酸化蛋白質組研究描繪出大量蛋白質的磷酸化修飾圖譜,極大程度地加深了對信號轉導網絡調控的全域性認識,也發現了不少與訊號通路失調相關的潜在藥物靶點。由於功能性磷酸化位點的修飾水准通常較低,如何在高通量分析磷酸化修飾的同時保證位點鑒定的準確性,並獲得精確的定量調控資訊,這是磷酸化蛋白質組學面臨的關鍵技術挑戰。
數據非依賴性(DIA)資料獲取是一種新型的質譜資料獲取方法,理論上可以數位化保存生物樣品蛋白質組的全部資訊。但DIA資料結構極為複雜,數據解析通常需要在預實驗中建立大容量的參攷譜圖庫,這個建立參攷庫的要求明顯加大了DIA組學實驗的難度和樣品消耗量。本研究工作首先建立了DeepPhospho神經網路模型,用於對DIA譜圖數據的預測(圖1),並在性能測試上優於已發表的譜圖預測模型。而後,研究者利用DeepPhospho構建完整的人源磷酸化蛋白質組的預測譜圖庫(圖2),借助反覆運算式檢索策略對DIA質譜數據進行深度挖掘。對同一套數據的比較研究發現,該新流程能獲得數目最多的磷酸化肽段與磷酸化位點的序列和定量資訊,並且省去對實驗參攷庫的需求,顯著簡化了實驗過程。為便於新工具的推廣使用,DeepPhospho還提供了線上網站版和離線工具包。
圖1.用於質譜譜圖和保留時間預測的DeepPhospho模型框架
圖2.利用DeepPhospho構建不同類型的預測譜圖庫
上海科技大學水雯箐教授和何旭明教授為該工作的共同通訊作者,生命學院博士研究生婁容琿和信息學院碩士研究生劉偉振為共同第一作者,信息學院博士研究生李榮頡和iHuman研究所研究助理李珊珊為本課題做出了重要貢獻。上海科技大學為第一完成單位。該工作得到了科技部、國家自然科學基金、上海市科委以及上科大科研啟動基金的支持。
論文連結:
https://doi.org/10.1038/s41467-021-26979-1
DeepPhospho連結:
http://shuilab.ihuman.shanghaitech.edu.cn/DeepPhospho