“中国松”背后的基因密码破解

内蒙古黑里河油松林 贾黎明摄

  ■记者 温才妃 通讯员 杨金融

  “松柏本孤直,难为桃李颜”“大雪压青松,青松挺且直”……古往今来,不乏人们对松树高直品格的赞美。

  作为我国特有的乡土针叶树种,油松的生态适生区达300万平方公里,因此也被称为“中国松”,但油松的基因密码一直是未解之谜。

  北京林业大学针叶树遗传育种团队联合瑞典农业大学、美国密歇根理工大学等6个国家11家单位的科研人员,共同揭示了油松演化关键特征的遗传基础,为深入理解针叶树演化机制提供了重要参考。12月29日,相关研究成果在线发表于《细胞》。

  解开针叶树基因组庞大之谜

  “被子植物基因组的众数值仅为0.6Gb(千兆碱基对),但针叶树却高达17Gb,油松基因组大小更是高达25.4Gb。”据论文共同第一作者兼通讯作者、北京林业大学生物科学与技术学院副教授钮世辉介绍,针叶树具有巨大的基因组,是研究植物基因组不同演化模式的理想对象,也是研究超大基因组如何保持稳定性与功能性的绝佳案例。

  针叶树基因组的巨大性主要来源于转座元件,其含量高达70%至80%。这些可自我复制的“入侵性”转座元件一旦被激活,对于整个基因组的稳定性来说将是一种灾难,不仅会引发难以预料的突变风暴,还有可能造成整个基因组的崩溃。

  “所以针叶树必须进化出一套严密的监管系统,最大限度抑制这些转座元件的活性。DNA甲基化很可能是其中核心的监管机制,我们发现油松具有迄今为止植物中报道过的最高的DNA甲基化水平。”论文共同第一作者、北京林业大学博士后李江说。

  然而,这种严密的监管有一个副作用。“它同时抑制了基于同源重组的重复序列的清除效率,也就是说,转座元件一旦复制便很少有机会被清除,因此针叶树的基因组演化进入了一个死胡同—— 一直膨胀。”钮世辉指出,在超剂量转座元件的冲击下,强大的DNA甲基化监管系统是维持基因组稳定性的迫不得已的手段,但同时也“锁死”了基因组缩小通路,造成针叶树基因组的膨胀仅有一张“单程票”,这可能就是针叶树都具有巨大基因组的原因。

  针叶树保持基因组功能性的秘密

  据李江介绍,该研究组装了首个染色体水平的松树基因组,发现针叶树基因组在膨胀的过程中,其基因长度也在成正比地增大。油松基因中具有大量的超长内含子,其平均内含子长度达10kb(千碱基),是被子植物的20倍。由于大量单个基因的长度甚至超过此前针叶树基因组组装碎片的长度,因此,许多超长基因的全长序列为该研究首次鉴定到。

  令人惊奇的是,这些超长内含子似乎并没有给臃肿基因的转录带来负面影响,与预期相反,超长基因倾向具有更高的表达活性。而在被子植物中,内含子中插入5.8kb的T-DNA到基因区通常会完全阻断靶基因的表达。针叶树这种罕见的转录调控能力可能依赖于基因组中数量加倍的转录调控因子(TR)参与,同时也保障了针叶树超大基因组的功能性。这种对超大基因转录负担的耐受性和偏好性,可能是针叶树与被子植物完全不同的基因组演化策略的遗传基础。

  “转座元件的插入是随机的,因此基因组扩张的同时不可避免地造成基因长度的增长,如果大量的基因像被子植物中那样被随机插入序列‘沉默’掉而无法正常表达,很可能这个物种就在自然选择中灭绝了,但针叶树进化出了难以置信的转录能力。”钮世辉说。

  针叶树“异曲同工”的适应性机制

  针叶树分布范围极广,是北半球森林生态系统的骨干,同时也是世界林业的主导树种。作为广泛分布的先锋树种,针叶树一直以其卓越的抗逆性而著称,然而其适应性的分子基础目前尚不清楚。

  此前研究表明,全基因组复制事件(WGD)可能为被子植物自白垩纪中期后的快速扩张提供了重要进化动力,更高的基因冗余性使多倍体通常在逆境中表现出更强的适应性。然而,针叶树中WGD的发生频率远低于被子植物。

  本研究发现,虽然油松在进化中经历过2次极古老的WGD,但其祖先在近1亿年内再未发生过WGD。

  不过,令人惊奇的是,油松超过91%的基因都发生了复制,主要通过散在重复机制复制,其中显著扩张的基因家族在生物与非生物胁迫响应通路极显著富集。因此,基因复制带来的基因冗余性可能与全基因组复制功能“异曲同工”,赋予了针叶树更强的适应性,其中抗逆性相关基因的大量积累可能为针叶树卓越的抗逆性提供了遗传基础。

  松脂生物合成是松类植物的重要特征,在抗虫、抗病、抗非生物胁迫中均发挥着重要作用。有趣的是,该研究首次把油松的汉语拼音“you song”引入英文文献(英文字面含义为“君之颂”),并解释了其汉语词义“多脂的松树”。

  该研究解析了针叶树中最完整的松脂合成通路,发现油松多数位点基因数量与被子植物相似,但关键限速酶发生了剧烈扩张,同时在油松中发现了134个松脂萜类化合物合成基因(TPS),油松也是迄今为止发现的存在TPS基因数目最多的物种。这些扩张基因有规律地按功能分类成簇地聚集在染色体上,在DNA上铭刻着“油松”富产松脂的密码。

  “针叶树研究十分困难,与被子植物研究相比仍十分滞后。本研究是北京林业大学针叶树遗传育种团队传承四十年取得的重要突破,我们期待以该研究为起点,破解更多针叶树特异的生长发育的秘密,为这类全球重要的生态与用材树种的高效遗传改良提供理论基础,也为更全面理解植物各异的演化机制提供被子植物以外新的视角。”钮世辉如是说。