10月25日,图书馆VIP生命科学与医学部瞿昆教授课题组在《自然·通讯》期刊上发表了文章“Comparative analysis of methodologies for detecting extrachromosomal circular DNA”,系统性评估了7种在测序数据中鉴定eccDNA的分析算法及7种不同实验建库方法的性能和差异。
染色体外环状DNA(Extrachromosomal circular DNA, eccDNA)作为一种在真核细胞内广泛存在的环状DNA,在肿瘤研究中具有重要意义。在肿瘤细胞中,eccDNA参与癌基因扩增,基因转录调控和肿瘤异质性,从而促进肿瘤发生和发展。因此,对eccDNA的深入研究可以推动我们对肿瘤发病机制的理解,也为靶向药物的开发提供新的方向。
目前,尽管已有多种测序建库方法和生物信息学算法用于eccDNA的鉴定,但eccDNA片段的大小多样且来源于不同基因组区域,实验和分析结果在不同方法间存在较大差异,给研究人员选择最适分析算法和实验方法带来挑战。现有的评估通常只关注准确性或计算需求等单一因素,并且往往基于过于简化的模拟数据,难以反映真实测序数据的复杂性。各类实验方法在检测eccDNA效率方面的显著差异,更加凸显出系统评估这些方法的重要性。
图:eccDNA鉴定的分析算法和实验方法系统性比较工作流程
研究结果表明,Circle-Map和Circle_finder在短读长测序数据中检测eccDNA具有更高的效率。然而,Circle_finder存在一定的局限性,容易生成冗余结果,即在相同eccDNA的鉴定上出现重复。CReSIL在长度长测序数据(特别是测序深度超过10X时)的eccDNA检测中表现最佳。在实验方法方面,Circle-Seq-LR特别适用于检测长度超过10 kb且具有拷贝数扩增的eccDNA (也称ecDNA),这类eccDNA与肿瘤进展密切相关。此外,不同实验方法检测到的eccDNA在长度、癌基因组成和基因重复元件的包含等方面展现出显著的异质性。该研究不仅深入分析了各种检测eccDNA的分析算法和实验方法的优势和局限性,还在GitHub上提供了完整的分析流程、代码和模拟数据集,旨在帮助研究人员根据自身数据特点选择最优的分析流程,为进一步提升eccDNA检测方法奠定了参考基础。
该研究由瞿昆教授、郭闯副教授共同指导并担任通讯作者,课题组博士后高绪远、课题组已毕业学生刘柯和博士生罗淞文为本文的共同第一作者。这项工作得到基金委杰出青年基金、面上基金,科技部国家重点研发计划,中国科学院基础研究青年团队,安徽省科技重大专项等项目的经费支持。
论文链接:https://www.nature.com/articles/s41467-024-53496-8
(生命科学与医学部、科研部)