当人类基因组计划完成草图时,科学家们首次拼凑出约30亿个碱基对的“生命天书”;而20年后,借助长读长测序技术的突破,一场更精细的“基因组考古”正在改写我们对遗传变异的认知。近日,两项发表于《自然》(Nature)杂志的国际合作研究,利用牛津纳米孔(Oxford Nanopore)和太平洋生物科学(PacBio)的长读长测序技术,对“千人基因组计划”(1000 Genomes Project)的千余份样本进行了深度解析,首次绘制出覆盖全球26个人群的“结构变异(SVs)高清地图”,揭示了超16万种此前未被发现的人类基因组变异细节。
从“短读长”到“长读长”:基因组变异检测的“分辨率革命”
自2008年启动以来,“千人基因组计划”通过短读长测序(每次读取约150-300个碱基对)构建了人类基因组变异的“基础地图”,但受限于技术,短读长难以捕捉重复序列、高度相似区域(如同源染色体)及大段插入/缺失等复杂结构变异(SVs)。这些“隐藏”的变异被认为与癌症、罕见病、自闭症等多种疾病密切相关,却长期处于研究的“盲区”。
此次突破的核心,正是长读长测序技术的成熟——其单次读取长度可达数十万甚至数百万个碱基对,能跨越复杂区域“全景式”扫描基因组。正如欧洲分子生物学实验室(EMBL)的扬·科尔贝尔(Jan Korbel)所言:“新技术让我们能组装完整的人类基因组,系统检查每个区域的变异,这是短读长时代无法想象的。”
1019份样本的“变异全景图”:发现超16万种新结构变异
在第一项研究中,由科尔贝尔领衔的国际团队分析了来自欧洲、东亚、南亚、非洲和美洲26个人群的1019份“千人基因组计划”样本,结合长读长测序与自主研发的“图增强结构变异分析(SAGA)”算法,共检测到每个样本平均15,301至21,529种结构变异(包括缺失、重复、插入、倒位等),并在967份匹配高覆盖短读长数据的样本中,鉴定出近167,300个主要变异位点。
更关键的是,约51%的插入变异和14.5%的缺失变异是此前从未被记录的“新变异”。这些变异广泛分布于基因组的“复杂区域”——例如包含大量重复序列的着丝粒、免疫相关的“主要组织相容性复合体(MHC)”区域,以及与癌症相关的致癌基因附近。
“原‘千人基因组计划’标记了基因组的‘变异热点’,而我们的工作让这些热点‘高清化’。”论文合著者、EMBL-EBI研究员萨拉·亨特(Sarah Hunt)解释,“新图谱的精度和深度远超以往,未来有望直接关联更多疾病风险。”
65个“近完成基因组”:揭开Y染色体与移动元件的“隐秘世界”
第二项研究由“千人基因组计划”人类基因组结构变异联盟(HGSVC)主导,聚焦65个个体的“近乎完整”基因组组装(覆盖99%以上序列)。通过整合长读长测序、光学图谱(Bionano)、Hi-C染色质构象捕获等技术,团队首次构建了130个单倍型解析的基因组组装(即区分同源染色体的差异),并覆盖了1,246个人类着丝粒序列——此前这些区域因高度重复被视为“测序禁区”。
研究显示,每个个体平均携带26,115种结构变异,其中包括12,919种移动元件插入(如转座子)。更令人振奋的是,团队首次完成了6个个体的“端粒到端粒”Y染色体组装(覆盖整个Y染色体),揭示了Yq12区域(高度异染色质)的精细结构。“现在,我们可以精确说出一个突变的起点、终点和具体形态。”论文共同第一作者、杰克逊实验室计算生物学家彼得·奥达诺(Peter Audano)表示,“这对自闭症、罕见病和癌症研究而言,是跨越数十年的进步。”
从“数据”到“应用”:疾病研究的“新工具箱”
两项研究的成果不仅是学术突破,更直接指向临床转化。例如,研究团队利用长读长测序分析了4名罕见病患者的全基因组,平均锁定了386个候选结构变异,并发现这些变异集中在270个已知致病基因的复杂区域——这意味着,此前因技术限制被遗漏的“致病变异”将被重新“挖掘”。
“现在,科学家研究癌症驱动突变、罕见病致病基因时,终于能‘看清’整个基因组的‘地形’。”奥达诺比喻道,“过去我们像在雾中摸象,现在至少有了清晰的轮廓。”
不过,研究者也坦言挑战犹存:极罕见结构变异的检测能力仍需提升,长读长数据的“一致性”(不同技术平台的结果整合)仍需优化,且大规模人群的泛基因组分析(如纳入更多非裔、原住民样本)亟待扩展。正如论文作者指出:“未来的工作需要改进图算法,将单核苷酸多态性(SNPs)、插入缺失(indels)和短串联重复序列(STRs)纳入统一分析框架。”
人类基因组的“终极拼图”渐趋完整
从2001年人类基因组草图的发布,到2023年人类泛基因组参考项目的推出,再到今日长读长测序对结构变异的“高清解码”,人类对自身遗传密码的认知正以指数级速度跃迁。正如海因里希·海涅大学杜塞尔多夫分校的托比亚斯·马沙尔(Tobias Marschall)所言:“这两项研究不仅构建了一个医学相关的资源宝库,更开启了‘精准基因组学’的新纪元——未来,每个人都能拥有自己的‘变异地图’,而疾病治疗也将真正进入‘按图索骥’的时代。”
- 本文固定链接: https://www.maimengkong.com/zixun/1975.html
- 转载请注明: : 萌小白 2025年7月18日 于 卖萌控的博客 发表
- 百度已收录