计算机模拟揭示物种多样化取样策略对贝叶斯支端定年的影响

       物种分化时间估算是生物系统学研究中的热点和难点,它为探究物种演化的历史过程、演化的速率、生物多样性的变化等提供重要依据。目前主流的物种分化时间估算方法是在贝叶斯分析框架下,基于分子钟理论,整合现生物种的分子序列和化石物种的时间和形态信息进行估算。 

  伴随下一代测序技术的发展,越来越多的物种基因组得到测序,巨量分子数据继而用于系统发生组学研究。全球著名的生物测序计划(如EBP和Fish10K等)均采用多样化策略开展物种取样并测序,比如第一阶段选择某类群各目的代表物种,第二阶段选择各科的代表物种,以此类推。那么,在系统发生组学时代,更高的取样密度能否最终估算出更加准确的物种分歧时间? 

  针对该问题,中国科学院古脊椎动物与古人类研究所张驰研究员联合中科院动物研究所罗阿蓉副研究员、朱朝东研究员、周青松博士和悉尼大学Simon Ho教授开展合作研究。该研究采用计算机模拟,在化石生灭过程和多样化取样策略下(Zhang et al. 2016),以不同的比例取样现生物种(图1),并模拟化石的形态数据以及现生物种的形态和分子数据。然后使用贝叶斯支端定年法和BEAST2软件进行分析。研究还分析了一组胎盘哺乳动物的真实数据和模拟的结果进行对比。

  研究结果表明,提高现生物种的取样密度并不一定带来更加准确的物种分歧时间估算结果;而树根时间的先验、树拓扑先验、化石的数目、是否使用形态数据等其它因素更加显著地影响分歧时间估算结果(图2-3)。胎盘哺乳动物的数据分析也为部分模拟结果提供了佐证。该研究由此揭示了:在系统发生组学时代,估算物种分歧时间时应该更加重视先验模型和参数的设置和改进,以及形态特征数据的使用。 

  相关研究成果以“Impacts of taxon-sampling schemes on Bayesian tip dating under the fossilized birth-death process”为题于近日在线发表在(Systematic Biology)《系统生物学》杂志。张驰研究员为共同第一作者,罗阿蓉副研究员为第一和通讯作者。朱朝东研究员和Simon Ho教授对文章的贡献等同。张驰负责了大部分模拟流程的设计工作,并为贝叶斯支端定年和BEAST2软件的使用提供指导和提供部分计算资源。该研究得到了国家自然科学基金委、科技部重点研发、中国科学院项目等的资助。

  论文链接:https://doi.org/10.1093/sysbio/syad011 

图1:多样化取样策略及不同的取样比例。

图2:不同取样密度下参数估计的准度和精度。考察了严格和宽松分子钟以及是否使用形态特征等情况。

图3:树根时间的先验和树拓扑先验对估算冠群节点时间的影响