核糖体操纵子、生物合成基因簇(BGCs)...三代宏基因组全搞定!

张开发
2026/6/26 10:08:08 15 分钟阅读
核糖体操纵子、生物合成基因簇(BGCs)...三代宏基因组全搞定!
上期我们提到三代宏基因组在组装高质量、完整的MAG上有着显著的优势(NM趋势子刊三代宏基因组cMAGs研究)那么除了组装高质量MAG基于三代宏基因组技术还可以在哪些研究内容上有所突破呢全球热点耐药基因研究纳米孔长读长宏基因组测序的组装序列N50达20-70 kbp相较而言Illumina短读长宏基因组测序的组装序列N50仅为1-2 kbp。长序列的获取显著提升了分析性能不仅能准确鉴定耐药基因亚型、精细注释遗传环境还可预测耐药基因在质粒或染色体上的定位、水平转移潜力及宿主菌信息。基于三代纳米孔宏基因组和二代宏基因组技术从研究样本中斯里兰卡医院污水中共检出25种ARG type[1]其中多药耐药、氨基糖苷类、β-内酰胺类、多粘菌素类和四环素类这五种类型在所有样本中占比最高变形菌门、厚壁菌门和拟杆菌门是携带抗性基因的主要菌门。对马肠道样本的研究中[2]借助三代纳米孔宏基因组技术在242份马肠道样本的2272份高质量MAG中检测了ARG的分布在25个耐药类别中共鉴定出266种独特类型的ARG其中氨基糖苷抗性基因最为丰富。图1 基于纳米孔宏基因组测序数据的分类树显示Pol-WWTP (a)、Kan-WWTP (b)和Mor-WWTP (c)中假定病原体携带的宿主范围和ARGs[1]。图2 马肠道抗生素耐药基因的分布[2]。生物合成基因簇BGC挖掘除抗性基因如ARG外生物合成基因簇biosynthetic gene clusterBGC作为另一类重要的基因集合类型近年来也受到研究者广泛关注。然而受限于短读长测序技术此前难以从未培养细菌中获取完整的BGC序列导致其多样性无法准确解析。三代宏基因组技术的应用成功突破了这一技术瓶颈。在Nature Biotechnology的一项研究中[3]研究团队开发了一种新型土壤微生物分离与DNA提取技术耦合优化后的纳米孔长读长测序平台成功完成土壤宏基因组的高质量测序与组装并从中分离鉴定出具有全新作用机制的BGCs。通过生物信息学手段对MAGs在分类学科水平开展了生物合成基因簇BGC的识别与定量分析。结果显示数据集平均每个科每百万碱基对Mbp携带1.3±0.7个BGC其中UBA5704、假诺卡氏菌科、链霉菌科及UBA11063四个科的BGC密度尤为突出均超过3个/Mbp。值得注意的是数据集中的Aquella物种展现出极高的BGC丰度且这些基因簇绝大多数为非核糖体肽合成酶NRPS型BGC。图3 a图基于图1d左构建的高质量连续组装序列系统发育树右侧显示每兆碱基对Mbp对应的细菌基因簇BGCs数量。b图代表性组装结果展示未充分覆盖的分类群扩展情况[3]。操纵子、防御系统三代宏基因组使得组装的连续性得到了显著的提升这就意味着复杂基因组区域的组装效果得到改善。长读长测序获得的MAGs具有一项优势其大多包含核糖体RNArRNA操纵子可直接与数千个已有的16S rRNA数据集及大型数据库进行比对。在陆地复杂生境研究中[4]借助三代纳米孔宏基因组测序完整操纵子形式的rRNA基因获取效率大幅提高下图同时防御基因岛尤其是CRISPR-Cas簇的完整性也更高。而且在该研究中也获得了更完整的生物合成基因簇BGCs与其他短读长获得的结果相比该研究中的得到的完整的BGCs的数量中位数是其的6.1倍。图4 大规模陆地环境研究中MAG组装结果比较。在MAGs中预测的rRNA操纵子(c)、防御岛(d)和BGCs (e)的基因簇总数[4]。挖掘细胞外遗传元素Inocle质粒等染色体外遗传元件能赋予宿主细菌环境应激抵抗能力包括抗生素耐药性。然而这些元件的遗传多样性及其在适应性中的功能作用由于二代测序的局限性目前还很不完善。25年新发表在NC上研究口腔微生物的文章中[5]借助三代宏基因组技术发现了一种名为“Inocle”的巨大细胞外遗传元素其可能在口腔微生物适应性进化中扮演着重要角色甚至有望成为某些癌症的新型生物标志物。三代纳米孔宏基因组分析85个因携带大量未知功能基因被特别认定为潜在新型遗传元件将该新型遗传元件命名为“Inocle”其代表人类口腔微生物组中新型ECEs。研究利用InoC深入探究Inocle家族重叠群的全球流行情况鉴定出29个完整的环状Inocle contigs同时利用公共数据唾液宏基因组比较Inocle地理分布、流行率。图5 四种Inocle分类群的鉴定与特征描述[5]。综上三代宏基因组技术可突破长复杂区域组装瓶颈显著提升单菌基因组组装质量大量获取高质量宏基因组组装基因组MAGs。同时在多个研究领域均有显著的优势其能深入挖掘抗性基因/功能基因系统解析质粒组Plasmidome和移动组Mobileome的遗传特征为微生态领域的高水平研究提供关键支撑。参考文献[1] Short- and long-read metagenomics uncover the mobile extended spectrum β-lactamase (ESBL) and carbapenemase genes in hospital wastewater in Sri Lanka. Water Research, 2025.[2] Expanded catalogue of metagenome-assembled genomes reveals resistome characteristics and athletic performance-associated microbes in horse. Microbiome, 2023.[3] Bioactive molecules unearthed by terabase-scale long-read sequencing of a soil metagenome. Nature Biotechnology, 2025.[4] Genome-resolved long-read sequencing expands known microbial diversity across terrestrial habitats. Nature Microbiology, 2025.[5] Giant extrachromosomal element “Inocle”potentially expands the adaptive capacity of the human oral microbiome. Nature Communications, 2025.

更多文章