首页 > 组学教程 > 一站式lncRNA查询数据库
2023
04-13

一站式lncRNA查询数据库

写在前面

在研究一个lncRNA之前,我们都要先去查看这个lncRNA可能的相关的功能。比如要查看这个lncRNA的表达、查看其相互作用的miRNA或者需要去查看调控这个lncRNA的转录因子。对于不同的需求需要使用不同的数据库。今天就来介绍一个一站式查询lncRNA相关功能的数据库: AnnoLnc2(http://annolnc.gao-lab.org/)。

image

这个数据库可以查询多个对于lncRNA多个方面的结果。一般这种汇总式的数据库,类似于一个中间站,是汇总了很多数据库的结果,所以我们就来介绍了一下数据库都有什么结果以及数据库的结果是基于什么做出来的。

数据库使用

首先需要注意的是,这个数据库可以对人和老鼠的lncRNA进行注释。这个数据库没有使用基因名数据的方式来进行查询。而是使用了输入Fasta序列的方式来进行查询的。我们需要做的就是选择物种、输入序列、提交结果

image

结果解读

在结果界面,首先能看到一个在左侧侧边栏有一个主要的结果。这个是数据库对于一个lncRNA所有相关的注释的条目。我们可以点击某一个标题就可以直接跳转到这个地方了。

1.结果汇总

首先我们看到的是一个对于检索的lncRNA的一个结果的基本汇总。我们可以在汇总当中了解关于这个lncRNA的基因总有显著的信息。

image

2. 基因组位置及结构

在基因组位置这里,数据库把我们提交的序列和目前已知的基因组序列进行比对,来查看这个序列具体的位置以及相关的特征。另外的话,关于序列特征当中,有一个重复序列的预测。这个作者使用的是RepeatMasker来预测的序列当中是否有重复序列

image

关于lncRNA本身的二级结构,这个数据库也进行了预测。具体的预测是通过ViennaRNA(http://rna.tbi.univie.ac.at/)数据库。这个数据库是专门用来预测RNA二级结构的。如果有其他二级结构预测的基因,可以去看一下。

image

3. 表达和调控

了解了lncRNA的序列特征之后,就要看这个lncRNA表的情况以及其相关的调控情况了。

3.1 表达情况

关于基因的表达情况,数据库使用了GETx数据库里面的正常组织、CCLE里面的癌症细胞系以及ENCODE数据库里面的数据来进行查看的。在结果呈现当中,也是分成了正常组织和癌症组织分类来查看的。

image

3.2 亚细胞定位

对于lncRNA表达的不同位置可能形式不同的功能。之前我们介绍过关于lncRNA亚细胞定位的数据库,具体的可以参考第二条推送。这个数据库也提供了相关的预测功能。具体的是使用了十种人类细胞胞质和胞核的表达测序的数据。通过比较核/胞质表达来确定这个lncRNA主要是在哪个地方表达。另外的也有包括说多种基序(motif)也是可以帮助lncRNA定位的。所以这个数据库就收集了和亚细胞定位的motif来进行预测。

image

3.4 表达调控

在表达调控方面,最经典的还是转录因子调控以及miRNA调控。这个数据库使用GTRD来预测lncRNA的可能收到的转录因子调控作用。同时使用TargetScan来预测其miRNA调控的作用

image

3.5 SNP调控

基因序列的改变也会影响这个基因的调控的。所以这个数据库通过GWAS数据库来寻找影响这个lncRNA的SNP。进一步的通过eQTL来评价哪些SNP对于这个lncRNA的表达有影响。这个分析的主要数据来自于GETx.

image

4. 相互作用与功能

4.1 与mRNA表达的相关性

由于使用的RNA-seq的数据,所以就可以看lncRNA的表达和哪些基因存在共表达关系。所以这个数据库提供了正常组织和癌症细胞当中共表达的基因。

image

4.2 与蛋白的相互作用

看完了mRNA的共表达。就可以 看这个和蛋白的关系了。这个数据库使用了目前发表的GEO上面的CLIP-seq的数据来进行分析。对于GEO里面没有的蛋白数据。数据库使用lncPro数据库来进行预测。所以在结果当中就包括两个部分。一个是lncPro数据库的结果,另外一个则是CLIP-seq分析的结果

image

4.3 功能预测

了解了lncRNA的相互作用的基因了。就可以来预测这个lncRNA的功能了。由于lncRNA本身是不会编码蛋白来发挥作用的。所以主要是通过其相互作用的基因来预测这个lncRNA的功能。这个数据库主要预测了lncRNA本身GO分析的功能。

image

5. 进化分析

最后对于基因的序列。不同的物种可能序列长度是不一样的,所以可以来进行物种之间的进化分析。来了解不同物种之间同一个lncRNA的进行情况。这个数据库主要是通过UCSC来下载相关的序列 。然后通过phyloFit来比较物种之间的进化关系。

image

数据库总结

如果我们要了解一个lncRNA的基本信息的话,基本上这个数据库做的已经很详细了。所以如果刚刚拿到手一个lncRNA可以通过这个数据库来看一下其基本的功能。然后看怎么来进行研究。



最后编辑:
作者:萌小白
一个热爱网络的青年!

发布评论

表情