首页 > 网络资讯 > 当归MADS-box生物信息学及SOC1克隆与表达分析
2023
05-13

当归MADS-box生物信息学及SOC1克隆与表达分析

当归Angelica sinensis (Oliv.) Diels为伞形科多年生草本植物,干燥根是我国传统中药材,素有“十方九归”之称,具有补血活血、调经止痛、润肠通便等功效[1]。现代药理学研究表明,当归根中的有机酸类、挥发油类和多糖类等化学成分在消炎、抗癌和治疗心脑血管疾病等方面具有显著效果[2]。目前,当归年需求量超3t,年种植面积达4.35hm 2[3-4]。然而,当归在第2年肉质根成药过程中,出现高达50%植株早薹开花的现象,导致肉质根木质化,药用有效成分含量降低且大量减产,药农经济收入减少,影响当归种质资源及产业发展[5-8]

MADS-box基因家族是一类广泛存在于真核生物中的转录因子,在植物花器官分化、开花时间调节、以及果实发育等方面起到重要的调控作用[9];其通常分为I型和II型,其中,II型有4个保守结构域:M-domainMADS-domain)、I-domain intervening domain)、K-domainkeratin-like domain)和C-domainC-terminal domain[10]。目前,在模式植物拟南芥中发现了deficiens DEF)、SQUAMOSASQUA)和TOMATO gene 3 TM3-like)等12MADS-box亚家族[11]。前期在当归转录组学的研究中发现,MADS-box亚家族基因,如SOC1suppressor of overexpression of constans1)、FLCflowering locus C)和AGL26agamouslike 26)等,在抽薹开花过程中差异表达[12-16]

研究证实,SOC1基因是花器官分生组织形成过程中的关键基因,其通过整合外界环境和内在因素等各种成花途径信号,激活下游花器官发育所需的基因,如LEAFYLFY)、APETALA 1AP1)和AGAMOUSAG),进而促进植株开花[17]。前期当归研究中发现,SOC1基因在完成春化作用的种苗根茎顶端分生组织以及早薹植株中高表达[12-13],其上游基因[如COL16constans-like)]和下游基因(AGL62)在抽薹开花过程中也呈现高表达[14]综合以上研究表明,尽管前人及本课题组已通过转录组测序获得了当归抽薹开花相关的MADS-box基因家族序列,并对关键基因(如SOC1AGVRN1)的表达水平进行了qRT-PCR检测与分析[12-16, 18],然而,针对当归MADS-box基因家族以及关键基因SOC1的生物信息学分析等方面的系统研究尚未有报道。因此,本研究基于前期当归全长转录组测序结果,开展了MADS-box基因家族生物信息学系统分析、SOC1-4基因克隆及表达验证,旨在深入揭示MADS-box基因家族的生物学功能,为有效抑制抽薹开花提供理论基础。

1 材料与仪器

1.1材料

当归MADS-box编码序列来源于:(1)不同品种(岷归1号和岷归2号)两年生大田植株叶片和叶柄的全长转录组,结果已提交NCBIAccessPRJNA782300),样品采集等详细信息见Zhu[18];(2)岷归1号种苗春化作用过程中[T10 ℃、14 d;未通过春化)、T20 ℃、60 d;通过春化)和T3(-3 ℃、125 d;低温规避春化)]根茎顶端分生组织的全长转录组,结果已提交NCBIAccessPRJNA789039),样品采集等详细信息见Luo[12],样品原植物均由甘肃农业大学栗孟飞教授鉴定为当归A. sinensis(Oliv.) Diels

1.2 仪器

台式高速离心机(德国SORVAL公司);ABI QuantStudio 5实时荧光定量PCR仪(美国ABI公司);超微量分光光度计(上海宝予德科学仪器有限公司)。

2 方法

2.1MADS-box家族鉴定理化性质及结构分析

蛋白质序列(包括氨基酸长度、相对分子质量和理论等电点)分析利用ExPASyhttps://web. expasy.org/protparam/);亚细胞定位利用Cell-PLochttp://www.csbio.sjtu.edu.cn/bioinf/Cell-PLoc-2/);蛋白质二级结构预测利用PRABI-Gerlandhttps://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_sopma.html);蛋白质3D建模利用Phyre 2http://www.sbg.bio.ic.ac.uk/phyre2/html/ page.cgi)。

2.2MADS-box家族系统发育树构建

NCBI数据库(https://www.ncbi.nlNm. nih.gov)选择模式植物拟南芥Arabidopsis thaliana L.和伞形科植物黄胡萝卜Daucus carota subsp.sativus (Hoffm.) 中与当归29MADS-box基因家族置信度较高的116个蛋白质,利用MEGA7.0软件最大似然法(maximum likelihood estimateMLE)构建系统进化树(重复次数1000次,其他参数为默认值)。蛋白质保守基序分析利用MEME(https://memesuite.org/meme/tools/meme),并利用TBtools进行可视化。利用DNAMAN软件进行蛋白质多序列比对(深蓝色表示相似度100%、粉色>75%、浅蓝色>50%)。

2.3 当归SOC1-4基因克隆

以岷归1号温室栽培植株功能叶片为材料(“1.1”项中T20 ℃、60 d通过春化,种苗移栽生长40 d),种苗种植及生长环境等详细信息见Liu[19]。总RNA提取使用Plant RNA Kit R6827Omega Bio-TekNorcrossGAUnited States),其纯度和浓度检测使用超微量分光光度计(Micro Drop,上海宝予德科学仪器有限公司);反转录使用First-Strand cDNA Synthesis SuperMix(北京百泰克生物技术有限公司)得到cDNA;利用NCBI Primer-BLASThttps://www.ncbi.nlm.nih.gov/tools/ primer-blast/)设计SOC1-4基因引物序列,forward5’-TGAGGGGAAAGACTCAGA-3’reverse5’-CTGTTTCGACATCGGAAT-3’;扩增产物利用1%TAE琼脂糖凝胶电泳进行检测;胶回收使用琼脂糖凝胶纯化试剂盒TIANgel Midi Purification Kit(天根生化科技有限公司),具体反应体系及条件见说明书。基因克隆使用平末端克隆试剂盒pHANDY®- Blunt Cloning Kit(哈尔滨晔健生物科技有限公司);引物合成及阳性克隆测序由兰州天启基因生物科技有限公司完成。

2.4当归SOC1-4基因表达分析

基因表达材料:(1)岷归1号两年生大田种植早薹(early boltingEB)和非早薹(un-early boltingUn-EB)植株叶和侧根(混合11),植株生长环境和样品采集等详细信息见Li[13];(2)岷归1号三年生不同生长发育期(S1:营养生长期、S2:营养生长到生殖生长过渡期、S3:抽薹初期、S4:抽薹伸长期)植株叶和侧根(混合11),植株生长环境和样品采集等详细信息见Li[14]的实验;(3)岷归1号不同春化期(T1T2T3)种苗根茎顶端分生组织;(4)岷归1号温室栽培植株(“1.1”项中T20 ℃,60 d通过春化,种苗移栽生长60 d)不同器官(根、茎、叶)。

利用NCBI Primer-BLAST设计SOC1-4基因qRT-PCR表达引物,forward5’-CGAAACGGCGA- AATGGACTG-3’reverse5’-CTGAATGTCTTG- CCCAGCAG-3’,引物合成由上海生工生物工程技术服务有限公司完成。以Actin作为内参基因[20],设计引物序列,forward5’-TGGTATTGTGCTG- GATTCTGGT-3’reverse5’-TGAGATCACCA- CCAGCAAGG-3’,利用FastKing cDNA KitKR116,天根生化科技有限公司)合成cDNA;利用SuperReal PreMix PlusSYBR Green)进行qRT-PCR检测,具体反应体系及条件见说明书。利用2△△Ct 法计算SOC1-4基因的相对表达水平[21]

2.5统计分析

qRT-PCR实验中,所采集材料进行了3个生物学重复和3个技术重复。运用Excel 2019进行数据的计算及制图。

3 结果与分析

3.1 当归MADS-box基因家族鉴定及理化性质分析

通过对当归不同品种叶片和叶柄、种苗春化作用过程中根茎顶端分生组织的全长转录组进行筛选,发现有29MADS-box基因,基于所编码蛋白质序列和亚细胞定位分析,结果显示,蛋白质序列长度为49AP1-1)~422At5g65490-1)、相对分子质量为5 697.5649 624.90、等电点为5.06J)~11.00AGL14-1),亚细胞定位分析预测29MADS-box蛋白分别位于叶绿体(AGL14-1At3g28050-2At5g65490-1)、细胞核(AGL14-2AGL16AGL19-122个)、细胞质(AP1-1AP1-2At3g28050-17个)和线粒体(SVP)(表1)。

3.2 当归MADS-box基因家族蛋白质结构分析

通过对29MADS-box基因所编码的蛋白质进行二级结构预测以及3D建模,结果显示,蛋白质二级结构由α螺旋、延伸链、β转角和无规则卷曲组成(表2);三级结构预测结果(图1)与二级结构(表2)相符合,主要由α螺旋、无规则卷曲和延伸链进一步折叠组装为三级结构,各亚家族内蛋白质三级结构较为相似,如AGL14-2SOC1-1SOC1-2SOC1-3SOC1-4均以α螺旋为主,无规则卷曲次之,β转角最少。但各亚家族之间空间结构差异较大,如AGL65SOK2AP1-2等以无规则卷曲为主、而AP1-1无延伸链(图1)。

3.3当归MADS-box基因家族发育树构建

通过对29个当归MADS-box基因家族蛋白质、61个拟南芥和55个黄胡萝卜MADS-box蛋白质进行系统进化树构建,基于蛋白质序列相似性,145MADS-box蛋白质分为10个亚家族,可分为I型和II型,其中,I型包括suppressor-likeII型包括SOC1TM3DEFMADS8SQUAFLCSTMADS11MIKCSOK;另外,SOC1亚家族包括5个当归MADS-box成员(SOC1-1SOC1-2SOC1-3SOC1-4AGL14-2)(图2)。

3.4 当归MADS-box基因家族基序分析

通过对以上29个当归MADS-box基因家族蛋白质、61个拟南芥和55个黄胡萝卜MADS-box蛋白质进行结构域和基序分析,结果显示,MADS-box蛋白质分为10个亚家族,与图2系统进化树关系一致,序列含有6个保守基序(表3);当归MADS-box同一亚家族蛋白质基序具有高度相似性,其中,SOC1亚家族均含有Motif 1Motif 5;不同亚家族蛋白质基序存在较大差异,比如,Motif 6只存在于suppressor-like亚家族(图3)。

3.5 当归SOC1亚家族蛋白质多序列比对

通过对当归SOC1亚家族5个成员(SOC1-1SOC1-2SOC1-3SOC1-4AGL14-2)及来自拟南芥(AtNP_182090.1)和黄胡萝卜(DcXP_017232221.12个物种的SOC1同源蛋白质等7个蛋白质进行多序列比对,结果显示,SOC1亚家族5个蛋白质均含MADS-domainI-domainK-domainC-domain结构域,其中,MADS-domain结构域高度保守,C-domain结构域保守性较低(图4);通过对SOC1-1SOC1-2SOC1-3SOC1-4进行进一步比对,发现SOC1-1SOC1-3SOC1-4蛋白质的4个结构域较为完整、且保守性较高,而SOC1-2C-domain不完整;其中,SOC1-1SOC1-3SOC1-4的相似性为73.27%

3.6当归SOC1-4基因克隆

为了保证全长转录组中当归SOC1-4基因碱基序列的准确性,基于全长转录组中SOC1-4基因碱基序列设计扩增引物,以岷归1号功能叶片中RNA反转录所得的cDNA为模板,进行SOC1-4基因克隆。琼脂糖凝胶电泳显示,SOC1-4基因扩增片段大小在500750 bp(图5);产物回收与碱基测序显示,SOC1-4基因克隆长度为585 bp;通过与全长转录组测序获得的SOC1-4进行序列比对,根据引物设计所得克隆结果与测序序列5-590 bp相似度为100%(图6)。

3.7 当归SOC1-4基因表达分析

为了进一步验证SOC1-4基因的生物学功能,本研究对当归不同材料中SOC1-4基因的表达水平进行了qRT-PCR检测与分析。结果显示,早薹植株相对非早薹植株,SOC1-4基因表达量上调6.42倍;不同生长期植株中,SOC1-4基因表达水平随着时间延长呈现逐渐增加,S2S3S4时期相对于S1时期分别增加2.162.315.79倍;不同春化期种苗根茎顶端分生组织中,通过春化作用(T2)处理相对于未春化作用(T1SOC1-4基因表达水平呈现3.39倍高表达,而规避春化作用(T3)处理相对于T1处理SOC1-4基因表达水平呈现0.48倍降低;不同器官中,茎和叶相对于根SOC1-4基因表达水平分别上调9.234.90倍(图7)。

4 讨论

目前,早薹开花导致根木质化不能入药仍是困扰当归生产、质量和效益提升的重大难题[4]。研究发现,当归抽薹开花受到内在(如种质、苗龄和种苗大小等)和外在(如温度、光照和干旱等)多种因素的影响[4, 22]。此外,当归为“低温长日照型”植物,即植株由营养生长转入生殖生长必须同时满足低温春化作用和长日照[22-24]。大量研究表明,MADS-box基因家族,尤其是开花抑制因子FLC和整合因子SOC1,在植物花器官分化和开花时间调节等方面起到核心调节作用[17]。尽管MADS-box基因家族在模式植物拟南芥及其他植物中调节开花的作用已进行了深入研究,然而在药用植物当归中的生物学功能还鲜见报道。本研究基于前期当归全长转录组测序,发现有29MADS-box基因分布于10个亚家族,所编码蛋白质序列含有6个保守基序,其中,亚家族有5个成员;另外,还对SOC1-4基因进行了克隆和表达分析,为后续探究SOC1在当归抽薹开花的分子调控研究奠定了基础。

模式植物拟南芥中有DEFSTMADS11TM3-like12MADS-box亚家族[11];山茶中有83MADS-box基因,可分为I型(亚家族)和II型(MIKC C MIKC * 亚家族)[25];荔枝中有101MADS-box基因,可分为I型和II型,其中,50I型分为Mγ 3个亚家族,51II型进一步分为MIKC * SOC1FLC13个亚家族[26]。本研究基于全长转录组鉴定出29MADS-box基因家族成员,基于蛋白质序列分为10个亚家族,可分为I型(Suppressor-like)和II型(SOC1TM3DEFMADS8SQUAFLCSTMADS11MIKCSOK);其中,SOC1亚家族包括SOC1-1SOC1-2SOC1-3SOC1-4AGL14-2。另外,前人预测22种植物(拟南芥、水稻、烟草等)的SOC1二级结构与亚细胞定位[27],与本研究MADS-box蛋白质理化性质和结构分析,尤其是SOC1亚家族等的结果基本一致,表明表明SOC1基因在进化上较为保守,在植物的生殖发育过程起着重要作用。

植物中MADS-boxI型和II型蛋白质结构域各具有高度相似性,其中I型只含有一个保守结构域,而II型均具有M-domainI-domainK-domainC-domain结构域,推测当归MADS-box基因功能存在多样性[7, 11, 28-30]。蛋白质保守基序比对发现不同亚家族保守基序存在数目及位置差异,预测不同亚家族功能有所差异。本研究中,SOC1亚家族均含有II型的4个结构域,通过对5个成员SOC1-1SOC1-2SOC1-3SOC1-4AGL14-2进行多序列比对,发现MADS-domain结构域高度保守,而C-domain结构域保守性较低。这表明,5SOC1亚家族成员在当归抽薹开花过程中可能发挥相似或协同的功能。另外,SOC1-1SOC1-3SOC1-4蛋白质的4个结构域较为完整,而SOC1-2C-domain不完整,而樊世婷等[31]克隆的当归SOC1基因(XM_017379845.1)与本研究中4SOC1基因比对存在差异,可能由于当归无参考基因组序列,转录组序列拼接参考不同物种而产生的差异;或全长转录组样本来自不同品种及材料所致。

尽管前期研究已获得了当归全长转录组,为了保证SOC1基因碱基序列的准确性、以及更深入探究SOC1基因的生物学特性,本研究通过克隆当归SOC1-4基因,获得了585 bp片段,与全长转录组测序中SOC1-4基因序列5-590 bp结果完全一致,大量研究证实,作为开花整合因子SOC1,在植物花器官分化和开花时间调控过程中高表达[17, 32]。本研究发现,SOC1基因表达量随着种苗春化作用和植株生长发育时期延长随之增加、在抽薹植株中高于非抽薹植株、而在冷冻规避春化作用种苗中显著降低。

综合以上研究表明,本课题组首次对当归MADS-box基因家族进行了挖掘和生物信息学分析,并对开花整合因子SOC1基因进行了基因克隆与表达验证。但对于SOC1基因片段的完整性、以及其它调控当归抽薹开花的关键基因(如FLCAGAP1等)还需要进一步研究和验证。

利益冲突 所有作者均声明不存在利益冲突

参考文献(略)

来 源:崔秀文,刘 迪,黄天苗,李美玲,栗孟飞,魏建和.当归MADS-box生物信息学及SOC1克隆与表达分析 [J]. 中草药, 2023, 54(5):1551-1560.



最后编辑:
作者:萌小白
一个热爱网络的青年!

发布评论

表情