等位基因_番茄泛基因组揭示了番茄新基因及调控果实风味的稀有等位基因

随着高通量测序技术的发展,测序成本持续下降,越来越多的物种获得了参考基因组序列。在获得参考基因组序列的基础上,人们还可以对某一物种的种质资源进行重新排序。在这个过程中,人们发现单个个体的基因组序列不能完全覆盖该物种的所有遗传信息,因此引入了泛基因组的概念。

庞氏体不仅可以获得相对完整的物种遗传信息,更有利于物种的功能研究和育种研究,而且可以说庞氏体研究也是获得高分文章的利器。例如,大豆、甘蓝、向日葵、水稻等的基因组研究。都发表在《自然》杂志上。这不仅仅是发表在《自然遗传学》上的番茄基因组文件。下面的小编辑将和大家一起看一下这个文档中完成的具体工作。

西红柿是世界上消费最多的蔬菜之一,2017年总产量为1.82亿吨,价值超过600亿美元。番茄基因组序列极大地促进了番茄的科学发现和分子育种。然而,栽培番茄在育种史上经历了严重的瓶颈效应,导致遗传基础狭窄然而,由于在自然和人工育种过程中,野生近缘种的遗传种被引入栽培番茄,栽培番茄也具有广泛的表型遗传多样性和代谢多样性的特点

等位基因

栽培番茄可分为两种类型,一种是栽培番茄番茄变种。番茄(SLL),果实大,另一个是早期驯化的番茄品种。樱桃大小的樱桃(SLC)自番茄基因组序列公布以来,已对数百种栽培番茄和野生番茄进行了测序。人们发现,在番茄育种的历史上,基因组已经发生了变化。然而,这些分析是通过将测序的短序列与参考基因组比对来进行的,在此过程中忽略了参考基因组中缺失的序列信息。在本研究中,我们采用了“映射-平移”策略来构建番茄基因组序列

材料

,725种番茄种质,包括栽培番茄及其相关野生种长果茄(SP)和干酪根和长角茄(SCG)栽培番茄的种类和数量如下:372个SLL,267个SLC;;野生番茄的种类和数量如下:78种,8种

测序数据|在199,725份种质中,有561份先前已被测序;剩余164种材料的高通量测序98个样品的测序深度超过20X,242个样品超过10X。

泛基因组构建方法

收集每种材料的数据,然后将所有收集的重叠群与公布的参考序列进行比较,构建泛基因组

结果子

1,栽培番茄和相关野生番茄的pangenome

被组装并与参考基因组序列比较,获得与参考序列(‘Heinz 1706’)的4.87Gb相似性和lt;90%的序列,449,614个序列经过去重复后获得,总长度为351兆字节。这部分序列在参考基因组序列中没有发现,重复序列比率为78.2%在这个351兆字节的序列中,有4873个蛋白质编码基因pangenome序列总长度为1,179Mb,包含40,369个蛋白质编码基因泛基因组包含一些在“亨氏1706”参考序列中没有发现的重要基因,如Hcr9-OR2A、I2C-1、Pto等。

等位基因

map番茄pangenome

2,蛋白质编码基因的PAVs分析

对586份种质(294份SLL,225份SLC,60份SP和7份SCG)进行了蛋白质编码基因的PAVs分析586份材料中含有40,283个总蛋白编码基因,其中29,938个(74.2%)为核心基因。99%、1-99%和小于1%的材料中含有的基因数分别为3232、5912和1287

分析还发现,野生番茄的编码基因数量(SP和SCG)比SLC多,SLC比SLL多,这表明在番茄驯化和后续改良过程中基因丢失发现驯化阶段丢失的基因数量多于改良阶段。通过构建系统发育树,进行主成分分析。研究发现,大多数野生番茄和驯化番茄可以明显分离,而两个驯化番茄亚种群可以分离但重叠。野生和栽培番茄中的

等位基因

Map基因PAVs

通过对SLC、SLL和SLC群体的柔性基因进行频率分析,筛选出驯化和改良过程中的基因PAV在驯化过程中,共鉴定出120个有利基因和1213个不利基因。在改良过程中鉴定的有利基因和不利基因的数量分别为12和665。大多数(94.9%)在一个阶段有利或不利的基因在另一个阶段表现出相同的趋势,表明在从驯化到改良的过程中可能存在共同和连续的选择偏好。驯化和改良过程中对不利基因的富集分析表明,这些基因主要富集在防御反应中,尤其是与细胞壁增厚相关的基因。在驯化的120个有利基因中,有21个富含氧化还原过程。分析还发现,在驯化过程中,不利基因和有利基因具有不同的分子功能。前者主要富集于ADP丁丙,而后者主要富集于辅因子、辅酶、黄素腺嘌呤二核苷酸丁丙。< br>

等位基因

map在番茄驯化和改良中对基因选择的偏好

3,在番茄育种中对启动子PAVs的选择< br>

分析发现,3,741个未包括在参考序列中的丛梗位于启动子区对这些序列进行分析后发现,在驯化和改良过程中分别选择了856和388个序列,选择方式与蛋白质编码基因相同,即驯化过程中对启动子序列的影响大于改良过程驯化和改良过程中选择的不良启动子序列比例分别为83.8%和99.2%。大多数不利启动子也表现出从驯化到改良的保守选择偏好,其中89.9%的启动子在从SLC到SLC和从SLL的过程中有相似的频率变化趋势。

4,一个改善番茄果实风味的稀有启动子等位基因;对

的基因组分析发现TomLoxC启动子有~4Kb的取代该基因可以通过催化脂质衍生的C5和C6挥发物的合成来影响水果风味在TomLoxC基因转录起始位点上游149bp处有两种基因型,一种是参考基因组“亨氏1706”中的4,724bp序列,另一种是泛基因组中的4,151bp序列(非参考序列基因型)91.2%的SP群体、15.1%的SLC群体和2.2%的SLL群体具有4,151 bp的非参考序列基因型,这表明该基因型在驯化和改良过程中受到了严重的负面选择。进一步分析显示,只有6个番茄具有纯合的非参考序列基因型,95个番茄具有两种基因型,473个番茄具有纯合的参考序列基因型非参考基因型在SP中所占比例最高(47.4%),而在SLC和SLL分别下降了8.4%和1.1%结合转录组分析,发现两种基因型的TomLoxC表达水平显著高于纯合参考序列基因型或非参考序列基因型。两个亲本(纯合非参比序列基因型和纯合参比序列基因型分别含有TomLox启动子)进一步构建了不同启动子等位基因的TomLoxC基因

等位基因

map表达差异

RIL群体,并对65种挥发性物质进行了QTL作图分析表明,19种脂肪酸衍生的挥发物和9种类胡萝卜素物质在1号染色体上含有相同的QTL(区间含有TomLoxC基因),该基因在RILs群体中表达水平最高,在双亲中表达差异最显著。通过进一步的转基因实验,证实了番茄红素在类胡萝卜素生产中的作用。< br>

本研究构建了栽培番茄和相关野生种的番茄基因组序列,并发现了番茄参考序列中不存在的351Mb序列和4,873个蛋白质编码基因这些基因在番茄改良中起着非常重要的作用同时,分析发现,番茄驯化和改良过程中大量基因的缺失导致了遗传多样性的下降现代番茄育种的主要目标是产量和对生物和非生物胁迫的抗性,同时忽略风味和品质相关性状,导致挥发性物质的减少。原因之一是在驯化过程中,TomLoxC启动子的非参考序列等位基因被强烈地选择为阴性。番茄基因组包含番茄参考序列‘亨氏1706’中不存在的遗传变异信息。这些变异信息可能在表型变化中发挥重要作用,并将有助于促进作物改良。本研究构建的番茄基因组将为番茄功能研究和分子育种提供重要资源。


参考文献:

1。大豆野生近缘种的重新组装用于多样性和农艺性状的全基因组分析[j .自然生物技术,2014,32(10):1045-1052.

2。赵庆,冯庆,陆宏,等.全基因组分析突出了栽培稻和野生稻基因组变异的程度[.自然遗传学,2018,50(2):278.

3。《一种在农业上很重要的作物——甘蓝——[的泛基因组》。自然通讯,2016,7:13390.

4。张JF,高玲,等。番茄全基因组揭示了新的基因和一个罕见的调节水果风味的等位基因。。自然遗传学,2019

大家都在看

相关专题