首页 > 组学教程 > Pacbio全长转录组测序
2023
01-16

Pacbio全长转录组测序

全长转录组研究是理解生物机体功能的一个重要途径。传统二代转录组测序无法直接获得单个RNA分子由5ˊ到3ˊ的全部序列。基于PacBio三代测序平台的转录组研究,无需打断,直接读取反转录的全长cDNA,能够有效的获取高质量的单个RNA分子的全部序列,准确辨别二代测序无法识别的同源异构体(isoform)、同源基因、超家族基因或等位基因表达的转录本。

 分析内容

 结果展示

ccs

CCS数据展示

PacBio测序仪每个cell含有ZMWs,reads进入ZMW孔中被测序,一个ZMW中含一条的reads(P1)为有效数据。通过有效数据的子序列获得一致序列即为每个单分子测序反应器ZMW的CCS序列。CCS序列是每个单分子测序反应器ZMW里插入序列的最高质量序列。CCS序列可以从一定程度上评估建库质量和SMRT® Cell上样时序列的长度。


.jpg

全长转录本数目统计

通过检测CCS序列中是否包含正确的5’引物,3’引物及polyA尾,将序列分成全长序列(包含5’引物,3’引物及polyA尾)和非全长序列。去除CCS序列中cDNA 引物序列及polyA序列获得建库时的插入序列,同时根据建库时两端引物的差别确定链合成方向,将序列分为全长序列和非全长序列、嵌合序列和非嵌合序列。全长序列长度反映了建库时cDNA序列长度,可通过统计全长序列的长度评估建库质量。


7-4

转录本GO注释

GO数据库是GO组织(Gene Ontology Consortium)于2000年构建的一个结构化的标准生物学注释系统,旨在建立基因及其产物知识的标准词汇体系,适用于各个物种。GO注释系统是一个有向无环图,包含三个主要分支,即:生物学过程(Biological Process),分子功能(Molecular Function)和细胞组分(Cellular Component)。

.jpg

可变剪接分析

基因转录生成的前体mRNA(pre-mRNA),有多种剪接方式,选择不同的外显子,产生不同的成熟mRNA,从而翻译为不同的蛋白质,构成生物性状的多样性。这种转录后的mRNA加工过程称为可变剪接或选择性剪接(Alternative splicing)。可变剪接类型包括:(A) 外显子跳跃;(B) 可变转录终止位点;(C) 可变外显子;(D) 可变转录起始位点;(E) 内含子保留。百迈客使用Astalavista软件获取每个样品存在的可变剪接类型。结合RNA-Seq数据可以使用rMATS进行不同分组间的差异可变剪接分析。


5-6

转录本NR注释

Nr数据库是NCBI中的非冗余蛋白质数据库,包含了Swissprot、PIR(Protein Information Resource)、PRF(Protein Research Foundation)、PDB(Protein Data Bank)蛋白质数据库及从GenBank和RefSeq的CDS数据翻译过来的蛋白质数据信息。通过序列比对寻找同源物种,并进行注释。

6-13

转录本KEGG注释

在生物体内,不同的基因产物相互协调来行使生物学功能,对表达基因的通路(Pathway)注释分析有助于进一步解读基因的功能。KEGG(Kyoto Encyclopedia of Genes and Genomes)是系统分析基因功能、基因组信息数据库,它有助于研究者把基因及表达信息作为一个整体网络进行研究。

.jpg

可变多聚腺苷酸化

多聚腺苷酸化是指多聚腺苷酸与信使RNA(mRNA)分子的共价链结。在蛋白质生物合成的过程中,这是产生准备作翻译的成熟mRNA的方式的一部份。在真核生物中,多聚腺苷酸化是一种机制,令mRNA分子于它们的3’端中断。多聚腺苷酸尾(或聚A尾)保护mRNA,免受核酸外切酶攻击,并且对转录终结、将mRNA从细胞核输出及进行翻译都十分重要。在原核生物中,前体mRNA的可变多聚腺苷酸化(alternative polyadenylation,APA)可能贡献于转录组多样性,基因组的编码能力以及基因的调控机制。百迈客采用TAPIS pipeline来对全长非嵌合序列(FLNC)进一步分析以识别APA。


转自:百迈克

最后编辑:
作者:萌小白
一个热爱网络的青年!

发布评论

表情