Nature|對包含110億種化合物的虛擬庫進行快速篩選

2021年12月15日,Nature雜誌發表文章,介紹了一種從包含110億種化合物的虛擬庫中識別潜在藥物分子的創新方法,並以3個目標蛋白的抑制劑篩選為例,展示了該方法的效能。高通量篩選和虛擬配體篩選的標準庫曆來被限制在不到1000萬個可用化合物,與潜在的1060個類藥物化合物的巨大化學空間相比,這只是一小部分。標準HTS和VLS的這種局限性减慢了藥物發現的速度。

2021年12月15日,Nature雜誌發表文章,介紹了一種從包含110億種化合物的虛擬庫中識別潜在藥物分子的創新方法,並以3個目標蛋白的抑制劑篩選為例,展示了該方法的效能。

庫越來越大,需要新的方法來蒐索

高通量篩選(HTS)和虛擬配體篩選(VLS)的標準庫曆來被限制在不到1000萬個可用化合物,與潜在的1060個類藥物化合物的巨大化學空間相比,這只是一小部分。標準HTS和VLS的這種局限性减慢了藥物發現的速度。

後來,包含數十億化合物的虛擬庫被開發出來。但隨著虛擬庫的規模新增到數十億,篩選庫中所包含的分子在計算上變得不切實際,而且成本過高。比如,使用1個CPU篩選100億個化合物可能需要3000年以上(以每個化合物10秒的標準速率對接)。

囙此,需要更有效的方法來蒐索大規模的化合物庫。

用於巨大化學庫的虛擬篩選方法

Sadybekov及其同事開發了一種被稱為V-SYNTHES的方法(virtual synthon hierarchical enumeration screening,虛擬合成子分級枚舉篩選),大大减少了在這些庫中蒐索潜在hits時需要評估的分子數量,使用的計算資源是標準方法的100分之1。

該方法可輕鬆擴展以適應組合庫的快速增長,並且可能適用於任何對接算灋。

V-SYNTHES的工作流程和結果

圖1一種處理巨大化學庫的虛擬藥物篩選方法

該方法的流程如下。

1.首先建立一個小型的虛擬庫。從110億個分子庫中選擇了大約60萬個片段,這些片段代表整個虛擬庫中存在的所有不同的骨架。稱之為最小列舉庫(minimal enumeration library,MEL)。

2.將MEL庫中的片段與3個目標蛋白對接,計算這些片段與每個蛋白的結合親和力。

3.選擇對接分數最高的1000-10000個片段,並向它們添加了合成子(synthons,分子的小片段),創建了一個約有100萬個分子的新庫。

通過重複對接和添加合成子的步驟,篩選幾百萬個化合物來確定hits。隨著每一次反覆運算,每個化合物的大小都會隨著分子變得更加完整而新增。

4.幾千個排名靠前的VLS化合物經過PAINS、物理化學性質、藥物相似性、新穎性和化學多樣性的後處理過濾,最終選擇有限的化合物集(通常是50-100個)進行合成和實驗測試。

作者發現,在V-SYNTHES預測的與這些受體結合並在低化合物濃度下抑制其活性的前60個化合物中,約有三分之一確實在體外顯示了這種效應。這個“hit獲得率”大約是作者使用的標準方法的兩倍,而V-SYNTHES需要的計算資源比這些方法少100倍。

作者隨後在一種叫做ROCK1的激酶上測試了V-SYNTHES,並報告了28.5%的hit獲得率。在被選中進行合成和體外測試的21個最有希望的化合物中,有6個可以與ROCK1酶結合,並在化合物濃度低於10微摩爾時對其進行抑制。這些化合物可以成為藥物發現計畫中進一步優化的合適線索。

V-SYNTHES的價值和意義

V-SYNTHES代表了藥物發現初始階段的兩種主要方法(基於結構的藥物設計和基於片段的藥物設計)的結合。在基於結構的設計中,分子的結構特徵及其與靶點的相互作用被用來指導設計過程。在基於片段的藥物設計中,分子基團被添加到最初因其潜在活性而被確定為有前途的片段中。

這篇論文為從現在可用的大型化合物庫中識別生物活性分子鋪平了道路,使用的計算資源和時間僅為標準虛擬篩選方法的一小部分,而且成功率更高。最重要的是,該方法的計算成本隨著使用的合成子的數量而新增,而不是隨著初始的主要庫的大小而新增。囙此,隨著現成的化合物庫及其組合的不斷增加,該方法將繼續具有計算上的可行性。

雖然該方法使用ICM-Pro對接並應用於Enamine REAL Space庫,但基於反覆運算合成子的篩選算灋可以在任何可靠的基於對接的篩選平臺上實現,並在任何可以表示為骨架和合成子組合的超大型庫中使用。在操作過程中可能需要對算灋的某些參數進行自定義調整以獲得最佳效能,從而為進一步探索該方法開闢了許多途徑。

V-SYNTHES的擴展性意味著用戶將能够在特別大的虛擬化合物庫中蒐索並找到具有生物活性的分子。該方法不能保證找到最好的hits,但這可能並不重要,因為次優的hits往往為藥物開發過程提供了良好的起點。

不過從長遠來看,虛擬篩選的更大問題是,無論該方法如何快速,其結果都取決於對接步驟的準確性。如同所有的虛擬篩選方法一樣,V-SYNTHES識別良好hits的能力取決於對接分數的準確性,需要有真正可靠的對接分數被開發出來。

參考資料

Deane C,Mokaya M. A virtual drug-screening approach to conquer huge chemical libraries.Nature.2021 Dec 15.doi: 10.1038/d41586-021-03682-1

adybekov AA,Sadybekov AV,Liu Y,Iliopoulos-Tsoutsouvas C,Huang XP,Pickett J,Houser B,Patel N,Tran NK,Tong F,Zvonok N,Jain MK,Savych O,Radchenko DS,Nikas SP,Petasis NA,Moroz YS,Roth BL,Makriyannis A,Katritch V. Synthon-based ligand discovery in virtual libraries of over 11 billion compounds.Nature.2021 Dec 15.doi: 10.1038/s41586-021-04220-9

資料標籤: 分子對接
本文標題: Nature|對包含110億種化合物的虛擬庫進行快速篩選
永久網址: https://www.laoziliao.net/doc/1656036351515424
相关資料
JAMA子刊|人工智慧準確預測誰將在兩年內發展為癡呆症
機器學習算灋能否準確預測記憶診所患者2年癡呆症的發病率,這些預測與現有模型相比如何?大多數記憶臨床MCI患者即使在10年後也不會進展為癡呆,年轉化率為9.6%。這些發現表明,機器學習算灋可用於準確預測2年癡呆風險,並可能構成臨床決策輔助的基
標籤: 癡呆症 機器學習
黑體輻射公式的多種推導及其在近代物理構建中的意義(一),|,賢說八道
黑體輻射,近代物理史上一隻會下金蛋的鹅——引出了一系列重要的物概念,量子力學、固體量子論、受激輻射、量子統計、等等。本文則全面地考察了黑體輻射這一概念的來龍去脈和延伸。在作者看來,“黑體輻射是近代物理研究方法的教科書回顧這段波瀾壯闊的歷史,
標籤: 黑體輻射 物理 普朗克 玻爾茲曼 普朗克公式 普朗克常數
【Plant,Cell】山東大學白明義組揭示TOR促進保衛細胞澱粉降解並誘導氣孔開放的機制
缺乏BAM1和AMY3的擬南芥表現出保衛細胞特异性澱粉過量錶型,並且對光的反應减少了氣孔孔徑。外源糖供應在碳饑餓條件下促進保衛細胞澱粉分解和氣孔開放。
標籤: tor 保衛細胞 cell
Cell重磅,何玉先/薛婧團隊發現強效愛滋病治療和預防藥物
愛滋病嚴重影響人類健康和社會經濟發展,但現時既無有效的預防疫苗,也無可以根治病毒感染的藥物。囙此,研究新的愛滋病長效治療和預防方法是當前重大科學問題,也是研究的難點,而探明病毒潜伏庫特徵和阻斷策略則是研究治療與預防方法的關鍵。該研究發現了強
標籤: 愛滋病治療 功能性治癒愛滋病 薛婧 恒河猴 科普 健康