OMIM(Online Mendelian Inheritance in
Man)数据库是一个全面且权威的人类基因与遗传表型数据库,广泛用于临床医学、遗传咨询及基础研究领域。该数据库系统收录了已知的孟德尔遗传病及相关基因的信息,为科研与医疗工作者提供了至关重要的参考资料。本文将简要介绍OMIM的基本结构、编号系统及常用功能,帮助使用者快速掌握其使用方法。
01 OMIM数据库简介
在线孟德尔人类遗传病数据库,网址为https://omim.org,进去之后就能看到一个非常简洁的搜索框:可以输入基因名,或者疾病名称,简称,全称均可。

我们先来看一下统计表格,Statistics-Entry- Statistics就能看到最新(Omim数据库基本上每个月的月底更新一次)的统计。

1 具基因注释的条目中,常染色体16747个,X连锁801个,Y连锁的有52个,线粒体37个。
2 以“#”开头的表示有表型描述,且分子机制明确的,常染色体6593个,X连锁396个,Y连锁的有5个,线粒体35个。
3 以“%”开头的表示表型有描述,但分子机制未知或者部分。

而表型与基因型的对应表格统计中,一个基因对应一种表型的有3522种,一个基因对应两种表型的有900种, 一个基因对应4种表型以上的,有253种。
常见问题解答(FAQ)
OMIM数据库中使用什么编号系统?
每个OMIM条目都有一个唯一的六位数字,总结如下:
1----- (100000- ) 2----- (200000- ) 常染色体基因或表型 (1994年5月15日之前创建的条目)
3----- (300000- ) X连锁基因或表型
4----- (400000- ) Y 连锁基因或表型
5----- (500000- ) 线粒体基因或表型
6----- (600000- ) 常染色体基因或表型 (1994年5月15日之后创建的条目)
MIM 编号前面的符号表示什么?
有了如上这些基本知识之后,我们便可以开始简单入门使用OMIM数据库了。
02 如何使用OMIM数据库使用
首先进入https://omim.org网站,可以直接在搜索框中搜索:基因名(比如DMD,GJB2,FBN1等),疾病全称或简称(比如DMD,CAH,duchenne
muscular dystrophy等),症状(比如deafness, blindness,growth delay,
developmental delay),这里不支持中文,只能用英文输入。
比如输入SMA,点击搜索,则得到以下的搜索结果:



点开clinical
synopsis这个临床症状,可以查看该疾病的一些症状,会影响心血管(CARDIOVASCULAR)、呼吸系统(RESPIRATORY)、神经系统(NEUROLOGIC)等等。以及一些流行病学数据,比如发病率为1/6000-/8000活产儿,发病年龄是出生到6个月,一般会在出生后2年死亡,95.6%的原因是由于父母的SMN1基因7号外显子缺失导致。

而其他部分则都是该基因的详细的介绍,包括该疾病的描述、诊断方法,临床干预手段,以及该疾病是什么时候被发现,被确认等等,相当于这种疾病的详细履历。

也可以点击下面的 Advanced Search OMIM,即高级搜索,可以看到如下界面:

而临床症状的高级搜索,是这样的界面:

比如输入blindness(盲),则会出现以下的搜索结果:

第一条就是一个3开头的6位数,说明是X连锁的夜盲症相关的基因。
还有一个Gene Map的功能,功能非常简单且实用,即输入一个染色体位置,可以是绝对坐标比如1:10,000-124,000,000,也可以是细胞遗传的区带 1p36-p32,搜索后,就会显示这个区间,包括了哪些基因。

但请注意,OMIM中一般用的绝对坐标是GRCH38版本的,而我们通常临床报告上以GRCH37为主,这个坐标需要进行转换,可以去UCSC网站的Lift Genome 功能进行转换,这个我们下次课再讲。
OMIM数据库是遗传性疾病研究和临床诊断中不可或缺的工具,通过系统化的基因-表型关联信息和详尽的临床综述,为用户提供强有力的数据支持。熟练掌握其检索方法与符号系统,将显著提升信息获取的准确性与效率,为科研和临床实践提供坚实基础。