项目文章|首个蔷薇科木瓜属植物T2T基因组为五环三萜生物合成提供新见解!
一、皱皮木瓜基因组的T2T组装

二、基因组注释
研究团队使用从头注释和同源注释的方法来鉴定重复序列,49.5%的皱皮木瓜基因组序列被预测为重复序列,约312.9 Mb。序列分析表明,重复序列主要由TE组成。其中,LTR最为丰富,占整个基因组的36.3%,包括Gypsy元件(22.7%)、Copia元件(7.3%)和其它序列。
基于从头注释、同源注释和转录组注释,共在皱皮木瓜中基因组中预测到45515个高置信度的蛋白编码基因,其中93%的基因都能得到功能注释。共鉴定到685个tRNA、4205个rRNA、 274个snRNA和739个snoRNA。
表1 皱皮木瓜基因组组装数据统计
三、比较基因组分析
研究团队选择11个物种与皱皮木瓜进行比较基因组学分析。基因家族聚类分析表明11个物种中普遍存在6958个基因家族,皱皮木瓜存在5658个特有基因家族。GO富集分析表明这些特有基因主要参与辅因子代谢、辅酶代谢和蛋氨酸代谢过程。KEGG富集分析表明,物种特有基因主要参与碳代谢、丙酮酸代谢、半乳糖代谢和萜类物质生物合成。系统进化发育分析表明,皱皮木瓜和苹果、杜梨、西洋梨被聚类在一起,它们可能由同一祖先进化而来。皱皮木瓜和苹果的分化时间约为10.0个百万年前,苹果族与桃亚属的祖先在约10.92个百万年前分化,蔷薇科物种在约98.81个百万年前分化。基因家族收缩扩张分析表明,皱皮木瓜有320个基因家族发生扩张,与苹果扩张基因家族数量相似;有158个基因家族发生收缩,约为苹果收缩基因家族的50%。皱皮木瓜收缩的基因家族主要富集于脂质转运、信号转导过程等,扩张的基因家族与单萜类、二苯乙烯庚烷类、姜辣素、亚油酸、类黄酮、倍半萜类和三萜类的生物合成有关。
图2 皱皮木瓜基因组同源聚类和系统发育分析
图3 皱皮木瓜的WGD特征、共线性和染色体进化
四、齐墩果酸和熊果酸代谢途径的构建
齐墩果酸和熊果酸是羟基五环三萜烯酸,《中国药典》中以齐墩果酸和熊果酸含量作为木瓜中药材质量控制的重要指标。植物五环三萜类化合物主要由甲羟戊酸途径和戊糖磷酸途径合成。本研究将皱皮木瓜与其它七个物种中涉及甲羟戊酸途径的四个基因家族进行比较,发现皱皮木瓜基因组中存在11个β-香树素合酶基因,其中10个基因分布在9号染色体上的两个基因簇中。基因簇1的长度从12,157,281 bp到12,428,418 bp,包含8个β-香树素合酶基因,9个其它基因和64个LTR反转录转座子。基因簇2的长度从31,206,028 bp到31,327,645 bp,包括2个β-香树素合酶基因,5个其它基因和29个LTR反转录转座子。基因家族的鉴定进一步揭示了2个角鲨烯合酶的成员、12个角鲨烯2,3-氧化环化酶的成员、11个β-香树素合酶的成员和9个β-香树脂醇28-单加氧酶的成员。与其它蔷薇科物种相比,角鲨烯合酶、β-香树素合酶和β-香树脂醇28-单加氧酶基因家族在皱皮木瓜基因组中显著扩张,这可能是该物种具有高含量的齐墩果酸和熊果酸的原因。
图4 皱皮木瓜中齐墩果酸、熊果酸的生物合成途径和β-香树素合酶基因簇
该论文通讯作者为华中农业大学植物科学技术学院舒少华副教授、王学奎副教授和南京农业大学的虞夏清副教授,武汉碳码生物科技有限公司贺少方和华中农业大学张毅鹏、国药集团中联药业有限公司翁端阳为论文共同第一作者。此研究得到了湖北省产业链关键项目(2021ACA004和2022AC003-01-003)的资助。