摘要
豹纹鳃棘鲈(东星斑)是商业渔业和水产养殖中重要的物种之一。近年,人们发现了两种不同颜色的豹纹鳃棘鲈,但这种颜色差异的生物学意义尚不清楚。由于在分子水平上对豹纹鳃棘鲈个体特征的研究较少,我们利用Illumina二代测序技术对黑色和红色豹纹鳃棘鲈进行了转录组学分析,分别产生和个双端测序读段(paired-endreads),从头组装分别产生了和个unique序列,其中个序列在它们之间共享。通过BLAST比对蛋白质数据库,约50%的转录组进行了功能注释。这两个转录组被富集到25个功能类别,并显示出相似的GO类别组成。个unigenes被归类到条KEGG通路。此外,我们还鉴定了个简单重复序列(SSRs),并设计了具有潜在应用价值的引物。我们还在这两个转录组中发现了个推测的单核苷酸多态性(SNPs)位点,为豹纹鳃棘鲈提供了潜在的基因组资源。此外,在两种颜色变种的正选择条件下,我们鉴定了个快速进化基因和个候选基因。 ,还分离出了38个潜在的与皮肤颜色和色素沉着机制相关的候选基因。本研究首次提供了豹纹鳃棘鲈的转录组资源,并为开发鉴定、保护和了解珊瑚礁鱼类的物种形成和局部适应的基因组工具提供了基础信息。
前言
热带珊瑚礁鱼类群落的高度多样性一直是生态和进化研究隐蔽多样性和分子分类学的重要内容。特别是珊瑚礁鱼类,如珊瑚鳟鱼(Plectroomusspp.),在皮肤颜色和色素沉着、体型和大小、鳍形态以及行为和生态活动方面表现出高度的表型可塑性。珊瑚鳟鱼的这些特性为研究在不同和复杂的珊瑚礁环境中的物种形成机制和局部适应提供了一个独特的模型。
豹纹鳃棘鲈(PlectroomusLeopardus)就是这种属于鮨科的珊瑚鳟鱼。珊瑚鳟鱼既是珍贵的海洋食用鱼,又是体色艳丽的观赏鱼,具有很高的经济价值。这种珊瑚鳟鱼主要分布在西太平洋地区,从日本南部向南到澳大利亚,向东到加罗林群岛。根据年和年的研究报道,线粒体DNA可以区分豹纹鳃棘鲈的黑色和红色两种颜色变种。由于具有很高的经济价值,这种珊瑚鳟鱼的野生种群已经被过度开发,并被世界自然保护联盟(IUCN)认为是受威胁的物种。以往对豹纹鳃棘鲈的研究主要集中在保护生态学、生殖生理、分子分类,以及幼体行为和早期生活史等方面。对该物种遗传资源的开发研究仅集中在微卫星标记的开发上。因此,该物种的基因组资源至今仍然匮乏,这极大地限制了该物种的遗传研究和遗传保护。
二代测序技术(NGS)大大降低了获取大量序列数据的成本,从而推动了模式物种和非模式物种的全基因组测序和转录组测序(RNA-seq)的快速发展。目前,RNA-seq已被广泛用于无参考基因组信息的非模式鱼类的整个转录组的研究。然而,目前还没有关于豹纹鳃棘鲈及其近缘物种的转录组测序研究。
为了获得该物种完整的转录组数据集,我们利用IllunimaNGS技术对豹纹鳃棘鲈的黑色和红色两种不同颜色变种进行了测序,并利用各种生物信息学工具对转录组进行了分析。我们的目标是:(1)获得豹纹鳃棘鲈两种颜色变种的高质量转录组组装和功能注释数据;(2)在两种颜色变种内部和之间发现大量的SSR和SNP标记;(3)鉴定两种颜色变种之间的一组快速进化基因,以及与皮肤颜色和色素沉着相关的候选基因。最重要的是,这两个转录组对珊瑚鳟鱼的基因发现、功能基因组学、种群遗传学和未来的基因组计划都有重要的辅助价值。这些转录组数据可能有助于理解珊瑚礁鱼类两种不同颜色变种之间的物种形成和适应性进化的机制。
结果
1转录组测序和组装
采用HiSeqTM高通量测序平台分别对黑色和红色豹纹鳃棘鲈进行转录组测序,分别共生成了和个原始读段(rawreads),进行质量控制筛选后,分别获和个净读段(cleanreads),其中分别有92.99%和92.67%的高质量读段用于转录组组装(表1)。
黑色和红色豹纹鳃棘鲈转录组数据进行Trinity组装分别产生了264和个contigs,N50分别为bp和bp(图1)。BLAST分析显示,黑色和红色豹纹鳃棘鲈的unigenes分别为和个,N50分别为bp和bp(表2)。黑色和红色豹纹鳃棘鲈的singletons分别为79和个,其中个为它们所共有(表2)。
表1.黑色和红色豹纹鳃棘鲈转录组的双末端Illumina测序的统计数据。
表2.黑色和红色豹纹鳃棘鲈转录组从头组装结果的统计数据。
图1.黑色和红色豹纹鳃棘鲈转录组的contigs长度分布
2
功能注释
对整个unigene数据集(个unigenes)进行功能注释,结果显示(53.58%)、(47.49%)、(38.41%)、(15.15%)和(34.42%)个unigenes分别与NR、SWISS-PROT、COG、KEGG和GO数据库比对到,共注释了(65.03%)个unigenes。用ESTScan将没有BLAST比对到的unigenes数据进行CDS序列的预测,其中个被认为是蛋白质编码基因。在这两个转录组中,共有个unigenes被归类为蛋白质编码基因,其余的可能是蛋白质编码基因和非编码基因的未翻译片段。
对NR数据库的BLAST分析表明,分别有66.83%和10.43%的unigenes与尼罗罗非鱼(OreochromisNiloticus)和黑斑鲀(TetraodonNigroviridis)的注释相匹配,其余的基因在斑马鱼(DanioRerio)、舌齿鲈(DicentrarchusLabrax)、裸盖鱼(AnoplopomaFimbria)、斜带石斑鱼(EpinephelusCoioides)、大西洋鲑(SalmoSalar)等物种的参考蛋白质数据库中被鉴定出来,其他物种的比对率低于5%(附加文件:图S1)。将与NR数据库同源的个unigenes归类为59个GO类,并将其分为生物学过程、细胞组分和分子功能三大类(附加文件:图S2)。共分成25个功能类别,其中 的是“一般功能预测”,有个unigenes,占45.57%;其次是“转录”有个unigenes,占22.78%;“复制、重组和修复”有个unigenes,占21.57%;“翻译、核糖体结构和生物发生”有个unigenes,占20.06%;以及“细胞周期调控、细胞分裂、染色体分割”有个unigenes,占18.44%。在整个转录组中,“核结构”(11个unigenes)和“细胞外结构”(40个unigenes)的代表性最少,不到1%(附加文件:图S3)。Unigenes的KEGG路径分类表明,个unigenes被比对到条通路上(附加文件:表S1)。富集程度 的前五个通路是代谢通路、肌动蛋白细胞骨架调控通路、肿瘤通路、粘着斑和MAPK信号通路(附加文件:表S1)。
3
SSRs和SNPs检测
总共在个unique序列中鉴定出个SSRs,其中包括个简单重复序列和个复合重复序列的SSRs。在这些SSRs中,二核苷酸重复是最常见的SSR,共有个,占总SSRs的43.22%,而单重复、三重复、四重复、五重复和六重复的重复次数为(25.37%)、(27.44%)、(2.12%)、(1.04%)和(0.81%)。除了CDS3末端的单重复基序A和T外,最常见的重复基序是AC和TG,而三重复基序CAG和GAG比其他双重复基序更常见(图2)。除单重复基序外,95.4%的SSRs的重复数不超过10(附加文件:图S4)。经过侧翼片段的筛选和引物设计,开发了对引物,用于扩增潜在的SSR(附加文件:表S2)。
对于SNPs的发现,在整个转录组数据集中总共发现了个推测的SNPs(附加文件:表S3)。在黑色和红色豹纹鳃棘鲈中分别检测到个和个SNPs,其中转换(A-G和C-T)分别为(71.01%)和(70.14%),颠换(A-C,A-T,C-G和G-T)分别为(28.99%)和(29.86%)。黑色和红色豹纹鳃棘鲈的转换和颠换频率差异不大(附加文件:图S5)。黑色豹纹鳃棘鲈和红色豹纹鳃棘鲈的整个转录组转换/颠换比率也相近,分别为2.45和2.35。在黑色和红色豹纹鳃棘鲈相同位置共有的个SNPs中,有个(44.15%)表现出相同的突变模式,而个(55.85%)表现出不同的突变模式(图3和附加文件:表S4)。筛选出侧翼区小于60bp的SNPs位点,共获得个SNPs位点,可用于未来的高通量SNP分析设计(附加文件:表S3)。
图2.豹纹鳃棘鲈整个转录组的微卫星重复基序及其丰富性统计。
图3.Venn图显示了黑色和红色豹纹鳃棘鲈转录组中推测的SNPs数量的差异和重叠。
4
正选择条件下候选基因的鉴定。
序列BLAST搜索指定了对黑色和红色豹纹鳃棘鲈之间推测的同源基因,这些基因具有合适的序列长度和突变数,可用于估计分子进化,并且还可以通过KaKs计算器程序计算Ka、Ks和Ka/Ks值。整个数据集的Ka、Ks和Ka/Ks的平均值分别为0.、0.和0.。总共对同源基因的Ka/Ks1,其中12对Ka/Ks2(图4和附加文件:表S5)。这些基因被比对到KEGG数据库,以鉴定丰富的生物信号通路。有趣的是,我们发现了几种与病*感染显著相关的通路,例如单纯疱疹病*感染、病*性心肌炎、HTLV-1感染和病*致癌。此外,这些处于正选择的候选基因在也免疫应答通路中富集,如溶酶体、ECM-受体相互作用、血小板活化、NF-κB信号通路和Toll样受体信号通路。 ,我们还发现了一些基本的生物学通路,包括细胞粘附,代谢通路,RNA转运,cAMP信号传导通路等(附加文件:表S6)。
在个同源基因中,有个被鉴定为快速进化的基因,排在Ka和(或)Ka/Ks值的前5%。通过比对到KEGG通路进一步分析这些基因,揭示了87个通路,每条通路至少包含5个快速进化的基因(附加文件:表S7)。这些通路涵盖了广泛的生物学功能,包括基本代谢通路、细胞周期、生长发育、能量代谢、细胞骨架和细胞粘附、微生物感染、免疫和应激反应、钙信号通路和缺氧(HIF-1信号通路)(附加文件:表S7)。
图4.黑色和红色两种豹纹鳃棘鲈推测的同源基因的Ka/Ks比值图,直线表示Ka/Ks=1。
5
鉴定与皮肤颜色和色素沉着相关的候选基因。
候选基因富集分析从两个转录组数据集中鉴定出38个参与皮肤颜色和色素沉着过程的候选基因,其中34个显示了在黑色和红色豹纹鳃棘鲈之间差异表达的信号(表3)。值得注意的是,发现有9个基因在黑色豹纹鳃棘鲈中特异表达,而只有1个在红色豹纹鳃棘鲈中特异表达(表3)。
表3.黑色和红色豹纹鳃棘鲈皮肤颜色和色素沉着相关候选基因的表达和注释。
总结
这项研究在基因鉴定、基因组标记发现和候选基因筛选等方面为研究珊瑚鳟鱼的基因组学、种群遗传学、生态物种形成和进化研究提供了非常有价值的基因组资源。
原文链接: