OMIM(Online Mendelian Inheritance in Man)数据库是一个全面且权威的人类基因与遗传表型数据库,广泛用于临床医学、遗传咨询及基础研究领域。该数据库系统收录了已知的孟德尔遗传病及相关基因的信息,为科研与医疗工作者提供了至关重要的参考资料。本文将简要介绍OMIM的基本结构、编号系统及常用功能,帮助使用者快速掌握其使用方法。
01 OMIM数据库简介
在线孟德尔人类遗传病数据库,网址为https://omim.org,进去之后就能看到一个非常简洁的搜索框:可以输入基因名,或者疾病名称,简称,全称均可。
我们先来看一下统计表格,Statistics-Entry- Statistics就能看到最新(Omim数据库基本上每个月的月底更新一次)的统计。
1 具基因注释的条目中,常染色体16747个,X连锁801个,Y连锁的有52个,线粒体37个。
2 以“#”开头的表示有表型描述,且分子机制明确的,常染色体6593个,X连锁396个,Y连锁的有5个,线粒体35个。
3 以“%”开头的表示表型有描述,但分子机制未知或者部分。
而表型与基因型的对应表格统计中,一个基因对应一种表型的有3522种,一个基因对应两种表型的有900种, 一个基因对应4种表型以上的,有253种。
常见问题解答(FAQ)
OMIM数据库中使用什么编号系统?
每个OMIM条目都有一个唯一的六位数字,总结如下:
1----- (100000- ) 2----- (200000- ) 常染色体基因或表型 (1994年5月15日之前创建的条目)
3----- (300000- ) X连锁基因或表型
4----- (400000- ) Y 连锁基因或表型
5----- (500000- ) 线粒体基因或表型
6----- (600000- ) 常染色体基因或表型 (1994年5月15日之后创建的条目)
MIM 编号前面的符号表示什么?
- 条目号前的星号 (*) 表示基因。
- 条目编号前的数字符号 (#) 表示它是描述性条目,通常为表型,不表示唯一位点。使用数字符号的原因在条目的第一段中给出。与表型相关的任何基因的讨论位于另一个条目中,如第一段所述。
- 条目号前的加号 (+) 表示条目包含已知序列基因和表型的描述。
- 条目编号前的百分号(%)表示条目描述了已确认的孟德尔表型或表型位点,其基础尚不清楚。
- 条目编号前的任何符号通常表示对表型的描述,尽管怀疑其孟德尔基础尚未明确建立,或者该表型与另一个条目中的表型的区别尚不清楚。
- 条目号前的插入符号 (^) 表示该条目不再存在,因为它已从数据库中删除或移动到另一个条目(如所示)
有了如上这些基本知识之后,我们便可以开始简单入门使用OMIM数据库了。
02 如何使用OMIM数据库使用
首先进入https://omim.org网站,可以直接在搜索框中搜索:基因名(比如DMD,GJB2,FBN1等),疾病全称或简称(比如DMD,CAH,duchenne muscular dystrophy等),症状(比如deafness, blindness,growth delay, developmental delay),这里不支持中文,只能用英文输入。
比如输入SMA,点击搜索,则得到以下的搜索结果:
- #开头,说明是这是一种表型,或者疾病;
- 2开头的6位OMIM号,说明这是一个常染色体疾病;
- 前面三个条目分别代表了SMA1型,2型,和3型;
- 点击第一条,就可以看到SMA1亚型的情况;
- 染色体区带信息: 5q13.2;
- 遗传方式:AR(常染色隐性遗传);
- 表型mapping信息是3(3表示分子机制明确);
- 致病的基因是SMN1,该基因的OMIM号为600354。
点开clinical synopsis这个临床症状,可以查看该疾病的一些症状,会影响心血管(CARDIOVASCULAR)、呼吸系统(RESPIRATORY)、神经系统(NEUROLOGIC)等等。以及一些流行病学数据,比如发病率为1/6000-/8000活产儿,发病年龄是出生到6个月,一般会在出生后2年死亡,95.6%的原因是由于父母的SMN1基因7号外显子缺失导致。
而其他部分则都是该基因的详细的介绍,包括该疾病的描述、诊断方法,临床干预手段,以及该疾病是什么时候被发现,被确认等等,相当于这种疾病的详细履历。
也可以点击下面的 Advanced Search OMIM,即高级搜索,可以看到如下界面:
而临床症状的高级搜索,是这样的界面:
比如输入blindness(盲),则会出现以下的搜索结果:
第一条就是一个3开头的6位数,说明是X连锁的夜盲症相关的基因。
还有一个Gene Map的功能,功能非常简单且实用,即输入一个染色体位置,可以是绝对坐标比如1:10,000-124,000,000,也可以是细胞遗传的区带 1p36-p32,搜索后,就会显示这个区间,包括了哪些基因。
但请注意,OMIM中一般用的绝对坐标是GRCH38版本的,而我们通常临床报告上以GRCH37为主,这个坐标需要进行转换,可以去UCSC网站的Lift Genome 功能进行转换,这个我们下次课再讲。
OMIM数据库是遗传性疾病研究和临床诊断中不可或缺的工具,通过系统化的基因-表型关联信息和详尽的临床综述,为用户提供强有力的数据支持。熟练掌握其检索方法与符号系统,将显著提升信息获取的准确性与效率,为科研和临床实践提供坚实基础。
- 本文固定链接: https://www.maimengkong.com/kyjc/2068.html
- 转载请注明: : 萌小白 2025年10月6日 于 卖萌控的博客 发表
- 百度已收录