首页 > 科研教程 > 整合uniprot等多个数据库,这个蛋白质数据库堪称巨无霸
2021
08-25

整合uniprot等多个数据库,这个蛋白质数据库堪称巨无霸

对于本来就没有多少时间做科研的医学生来说,拿到导师布置的课题时总是如履薄冰,因为导师总是一字千金,就简简单单说一句你去研究什么什么蛋白的功能,而后所有的背景知识都需要自己去查,如何才能快速的掌握自己需要研究蛋白的全部知识呢?今天笔者拿出多年的珍藏,给大家分享一个超好用的数据库SMART。

进入SMART数据库,网址为http://smart.embl-heidelberg.de/.进入网站首页,可以看到该网站也是相当简洁,最近两次更新的文章都发表在Nucleic Acids Res杂志上,影响因子为11.561。

在网页的上方,可以看到SMART有两种模式,分别为NORMAL何GENOMIC,点击SMART MODE可以看到对着两种模式的解释。这两种模式的主要区别是使用的数据库不同,NORMAL模式包含Swiss-Prot, SP-TrEMBL 和 Ensembl三个数据库;而GENOMIC模式是使用已经完成测序的蛋白质组数据。此外,两种模式的界面颜色也不相同,这样便于区别自己目前所用的模式,但是两种模式的搜索界面内容是相同的。

这里我们选择NORMAL模式,进入搜索界面,可以看到能够根据不同的方式查询目的蛋白,可以是序列ID号或者ACC号,也可以根据蛋白的序列,这里我们选择第一个范例——人源TEC蛋白,点击“#1”。

随后选择Sequence AMART进行分析,可以看到在图中会显示TEC蛋白的各个结构域的名称,将鼠标放置结构域上,还能显示各个结构域的氨基酸范围和数目。在各个结构域中出现的竖线表示内含子,点击上方的Introns按钮,这些竖线将会消失。与此同时,上方还有“+”和“-”按钮,可以根据需要对结构域图片进行放大和缩小,点击后面的SAVE,还能直接将结构域图片进行下载,可以直接放在文章中额。

在网页的下方,可以看到该TEC蛋白各个结构域的信息和氨基酸起始位置,这为我们研究相互作用domain提供非常大的便利。

在中间部分还可以看到该蛋白的一些信息,下面一一为大家讲解。

1. Information:该栏中显示了蛋白的基本信息,包括其氨基酸数目,不同数据库中的序列号以及不同的剪接体。

2. Architecture:进入该选项后,可以看到有两种选择,分别为Domain organization和Domain composition,通过不同的方式搜索和TEC类似的蛋白。

Domain organization是指包含TEC蛋白的所有结构域的蛋白质,点击后可以看到需要选择物种,这里我们选择所有的真核生物。

点击上方的Display proteins,可以看到会出现有很多包含TEC全部结构域的蛋白质。

Domain composition是指和TEC含有相同结构域的蛋白质,进入该选项,选择真核生物后同样可以获得与TEC类似的蛋白质。

3. Interactions:该栏中显示了TEC蛋白互作图,可以清楚的看到TEC和其他蛋白的相互作用情况,并且这个数据是直接链接到string数据库的,点击任何一个蛋白,就可以直接进入sting网站,非常方便。

4. Pathways:该栏目显示TEC涉及的信号通路,其中有两个选择,分别为map04660和K07364。

map04660是该蛋白涉及的T细胞受体信号通路,进入该选项后,可以看到信号通路图,这个图也是可以放大后直接下载使用的。

K07364选项是基于相似的KEGG同源组,目前涉及该蛋白的KEGG图还没有更新到,因此暂时搜索不到。

5. PTMs:该栏目显示的是TEC蛋白翻译后修饰情况,可以看到,该蛋白上总共含有44个修饰,包括35个磷酸化修饰,6个泛素化修饰和3个乙酰化修饰。

6. Orthology:该栏中可以查询到TEC在各个种属中的同源物。

根据这个网址我们不仅能够查询蛋白的基本信息、相互作用蛋白、翻译后修饰情况以及涉及到的信号通路,还能检索该蛋白的同源蛋白和结构类似蛋白。一个网站便能查询蛋白的所有背景信息,是不是很强大,你也赶快试一试吧。

最后编辑:
作者:萌小白
一个热爱网络的青年!

发布评论

表情