首页 > 组学教程 > 常用LC-MS平台公共代谢数据库类型大合集
2023
06-23

常用LC-MS平台公共代谢数据库类型大合集

我们知道在代谢组学实验鉴定后,原始数据经软件解析后将得到代谢离子以及二级碎片离子的谱图信息,如:离子的质荷比(m/z)、保留时间(Retention time)及在信号强度值(intensity)等,通过与数据库中一二级代谢物的谱图信息进行匹配,来确定检测到哪些代谢物。

但在谱图匹配中一定少不了数据库,继上期小编分享了四连发 | 新鲜出炉!同一期刊连发4篇,鹿明LC-MS非靶向代谢“大有可观”,很多老师对于LC-MS平台测下来的数据搜库及分析比较感兴趣,本期小鹿分享LC-MS常用的代谢物谱图库有METLIN、MassBank、mzCloud、HMDB、KEGG、MetaCyc、Lipidmaps、MS-Dial等;助力您代谢组学的研究!!

mzCloud数据库

mzCloud数据库由Thermo 公司隆重推出的云端质谱数据库,可以直接通过二维码扫描进行质谱图的云端检索。收集了数量庞大的高质量精度高分辨的多级质谱图,同时支持高、低分辨率质谱图(Spectrum)和质谱树(Spectral Tree)的在线检索与匹配,从而进行未知化合物的鉴定。

目前已涉及5千多种化合物,近15万张图谱,数量每天还在不断增加,而且每张图谱都是源于赛默飞的质谱仪,以一系列不同碰撞能量及碎裂方式等条件打碎后采集而来,重现性和匹配度非常高。

mzCloud

HMDB数据库

人类代谢组数据库(Human Metabolome Database,HMDB)是加拿大代谢组学创新中心(TMIC)创立的人体代谢组学综合数据库,是最常用的代谢组数据库之一。HMDB数据库开源,可免费访问下载,目前已更新至4.0版本,收录内容包括物质的化学信息、临床数据分子生物学数据等超过11万种代谢物的信息。诸如:DrugBank(常用药物数据库,包含约2280种药物代谢物信息)、T3DB(专门的毒物数据库,包含约3670种常见毒素和环境污染物代谢物信息)、SMPDB(常用的小分子代谢通路数据库,包含3万多个人类代谢物和疾病通路信息,通路图片很精美)和FooDB(专门的食品研究数据库,包含约28000种食品成分和食品添加剂代谢物信息)HFMDB(专门的粪便代谢物数据库,包含有关人类粪便中发现的许多小分子代谢物和许多浓度值的详细信息)等数据库都属HMDB旗下。

HMDB

DrugBank

T3DB

SMPDB

FooDB

HFMDB

mzCloMetaCyc数据库LUMINGBIO

与KEGG数据库相同,MetaCyc也是一款通路数据库,只包含非冗余且通过实验手段阐明过的代谢通路!MetaCyc 包含参与初级和次级代谢的途径,以及相关的代谢物、反应、酶和基因,在植物代谢组学中使用较为普遍。MetaCyc 目前包含 2937 条途径、17,780 种反应和 18,124 种代谢物,且在实时更新中。

MetaCyc

Lipidblast数据库

Lipidblast数据库由Fiehn实验室整理的一款开源数据库,该数据库包含了约10万种代谢物的20多万张MS2质谱图,LipidBlast还包含了许多没有被LMSD数据库收录的细菌和植物脂质信息。该数据库使用计算机生成了78314个正离子模式数据和134202个负离子数据,同时也包含了多种加合离子的类型。可作为Lipidmaps分析的补充,Lipidmaps和Lipidblast是目前最常用的脂质组鉴定数据库。

Lipidblast

METLIN数据库

METLIN数据库由美国斯克里普斯研究院(Scripps Research Institute)开发的,包含超过96万种化合物,这些数据来自多个QTOF质谱检测平台,包括SCIEX、Agilent、Bruker、Waters。METLIN现在拥有超过500,000种分子标准品,具有多种能量和正/负模式的MS/MS数据。

METLIN包括脂质、类固醇、小肽、碳水化合物、外源性药物/代谢物、中心碳代谢物和有毒物质等。

由于METLIN网站已商业化,其检索功能在国内无法使用。为了给科研工作者提供更全面更准确的代谢物数据信息,鹿明生物购买了METLIN网站的商业版数据库用于LC-MS/MS非靶代谢组学的代谢物鉴定研究

METLIN

MassBank数据库

MassBank数据库主MassBank是一个高质量的质谱数据库,旨在公开分享从代谢物的化学标准品得到的质谱图以方便用户进行代谢物的鉴定,包含了代谢物的质谱信息以及采集情况。

MassBank有三个不同的数据库:MassBank of North America (MoNa) 、the European MassBank 、the Japanese MSSJ MassBank,其中MoNa整合了更多来源的数据,因此相比其他两个更加受到科研工作者群体的偏好。

MassBank

KEGG数据库

KEGG数据库(Kyoto Encyclopedia of Genes and Genomes)全称是京都基因和基因组百科全书,目前发展为一个综合性数据库,含有18个数据库,分为三大类(系统信息、基因组信息、化学信息)。其中最核心的为 KEGG PATHWAY 和 KEGG ORTHOLOGY 数据库。

KEGG

Lipidmaps数据

Lipidmaps数据库由美国国立卫生研究院(NIH) 创立的脂质数据库,是目前权威的脂质数据库,收录超过4万种脂质的结构、谱图和分类信息。Lipidmaps根据脂质的结构和功能,将脂质分为8大类,脂肪酸类(Fatty Acyls),甘油脂类(Glycerolipids),甘油磷脂类(Glycerophospholipids),鞘脂类(Sphingolipids),固醇类(Sterol Lipids),异戊烯醇类(Prenol Lipids),糖酯类(Saccharolipids),多聚乙烯类(Polyketides)。该分类标准被广泛沿用。Lipidmaps数据库开源,可免费访问下载。

Lipidmaps

.



最后编辑:
作者:萌小白
一个热爱网络的青年!

发布评论

表情