數學院丨Bootstrap模型選擇方法的漸近行為研究

Bootstrap方法由Felsenstein於1985年引入系統發生學,是最常用的評估系統發育樹可信度的非貝葉斯方法。在這樣的視角下,使用bootstrap方法進行模型選擇的漸近理論的研究有重要價值。另一方面,在實際資料分析中,研究者發現在分析大規模基因組數據時無論估計的系統樹或者分支正確與否,bootstrap支持率都會偏高,引起這一現象的原因並不明確。

Bootstrap方法由Felsenstein於1985年引入系統發生學,是最常用的評估系統發育樹可信度的非貝葉斯方法。我們將系統發育重建看做統計學中的模型選擇問題,而非給定模型下的參數估計問題,每個可能的系統樹對應一個非嵌套的備擇模型。在這樣的視角下,使用bootstrap方法進行模型選擇的漸近理論的研究有重要價值。另一方面,在實際資料分析中,研究者發現在分析大規模基因組數據時無論估計的系統樹或者分支正確與否,bootstrap支持率都會偏高,引起這一現象的原因並不明確。

我們首次系統性的研究了不同情况下bootstrap模型選擇方法的漸近行為。研究結果表明,在最受關注的比較模型錯誤程度相同的情况下,當數據量很大時,模型的bootstrap支持率收斂到非退化分佈,不會呈現出貝葉斯模型選擇方法那樣的病態的極端結果。研究者們通常傾向於認為bootstrap支持率比貝葉斯後驗概率更加保守,我們的研究結果與經驗觀察相符,也為這一現象提供了理論解釋。但是,當比較模型錯誤程度相同且數據量很大時,模型的bootstrap支持率在不同數据集之間呈現出較大的波動,而非收斂到一個常數。囙此,在分析大規模數據時,也可能會對錯誤的系統樹或進化模型有較强烈支持。我們的分析結果為實際資料分析中觀察到的錯誤分支獲得較高bootstrap支持率這一現象提供了部分解釋。

這項工作發表在生物系統學旗艦期刊Systematic Biology上,與北京交通大學、英國倫敦大學合作完成。中科院數學與系統科學研究院朱天琪博士和海外領袖科學家楊子恒教授均為通訊作者。

Jun,H.,Yuting,L.*,Tianqi,Z.*,& Ziheng,Y*,2021,The asymptotic behavior of bootstrap support values in molecular phylogenetics.Systematic Biology,70(4):774–785.

資料標籤: 科學 貝葉斯 科普
本文標題: 數學院丨Bootstrap模型選擇方法的漸近行為研究
永久網址: https://www.laoziliao.net/doc/1656041807416410
相关資料
清華大學環境學院、碳中和研究院、哈佛大學等聯合團隊系統解析我國太陽能發電平價路徑與並網潜力
近日,清華大學環境學院、碳中和研究院、哈佛大學等國內外聯合團隊在碳中和背景下我國太陽能光伏發電平價動態與並網潜力研究方面取得新進展,系統動態評估了我國科技可行、經濟平價、電網相容的光伏發電潜力,揭示了光伏成本優勢下“光伏+儲能”的廣闊應用前
標籤: 光伏發電 太陽能光伏發電系統 並網光伏發電系統 聯合光伏 新能源 太陽能發電機
顛覆,吃得少確實活得久,但“何時吃”比“吃得少”更重要
在肥胖日益流行的當下,運動、健身以及均衡飲食等健康理念已成為共識,近年來,禁食被認為是一種有效的减肥管道而備受追捧。傳統上,熱量限制飲食的有益影響被認為是减少熱量攝入的結果,但最近人們意識到,通常在實驗室實施的熱量限制方案不但限制熱量,而且
標籤:
侯劍輝等人AM,用於高性能有機光伏電池的通用非鹵化聚合物供體
非鹵化聚合物由於其製備成本低的優勢,在有機光伏電池的商業化方面具有巨大潜力。然而,非鹵化聚合物在溶液中通常具有高HOMO能級和較差的自聚集效能,從而導致低功率轉換效率。中科院化學所侯劍輝和CunbinAn等人製備了兩種非鹵化聚合物PB1和P
標籤: 電池 光伏電池 光伏組件 光伏資料 光伏
為何身體某些部位對觸摸如此敏感?Cell為你揭秘
身體的某些部位更敏感,例如手和嘴唇,它們成為我們辨別周圍世界最複雜細節能力的重要工具。大腦為這些敏感的皮膚表面提供了相當大的表徵空間,這些皮膚表面專門用於精細的、有識別力的觸摸,並通過支配它們的感覺神經元不斷收集詳細資訊。但是,感覺神經元和
標籤: cell 身體發育 腦幹 科普