PBJ_Light control of three‐dimensional chromatin organization in soybean
标题:
Light control of three-dimensional chromatin organization in soybean
期刊:
Plant Biotechnology Journal(10.1)
发表单位:
北京大学现代农业研究院
研究背景:
近年的研究揭示了表观遗传机制(包括DNA甲基化、组蛋白修饰、非编码RNA及染色质高阶结构)在调控基因表达和细胞功能中的核心作用。通过Hi-C技术构建的三维基因组图谱显示,染色质通过形成TADs、A/B区室和染色体疆域(chromosome territories,CTs)等结构,动态调控基因活性。不同于哺乳动物依赖CTCF/黏连蛋白复合体介导染色质环挤压形成TADs,植物中TADs的建立可能由RNA聚合酶II(RNAPII)驱动的转录活性协同调控。研究表明,RNAPII不仅参与形成跨物种保守的染色质互作域,还能通过启动子-启动子互作协调基因共表达网络。
大豆(Glycine max)作为全球重要油料和蛋白质作物,其三维基因组研究揭示保守染色质结构,通过组蛋白修饰调控多倍化基因表达,驱动性状演化。光信号可诱导染色质动态重塑,如核内基因重定位及异染色质压缩,并调控器官特异性转录网络(如SAURs基因簇),为解析光响应分子机制提供新视角。
研究材料:
5种不同光照处理的子叶、顶钩和下胚轴组织
研究方法:
测序方案:
二代Illumina RNA测序:
二代BGI Hi-C测序:446.52 - 636.34 Mb clean reads
二代Illumina CUT&Tag测序:43.81 - 68.38 Mb clean reads
分析方案:
1. Peak Calling 识别表观修饰区域
2. 差异修饰分析
3. 差异基因表达分析
4. 功能富集(GO/KEGG)分析
5. 三维染色体结构识别及比较:compartment、sub_compartment、TAD、loop
6. 距离互作频率分析
7. ATA(Average TAD Interaction)分析
主要研究结果:
全基因组染色质组织动态受光影响
为探讨大豆幼苗在光形态建成过程中,基因组三维结构的动态变化及其在不同器官中的特异性响应。作者设计了五种光照处理条件,包括持续黑暗(cD)、生长于黑暗后转移至光照1小时(D1L)、6小时(D6L)和24小时(D24L)的处理组,以及持续白光(cL)照射组(图1a)。研究表明,大豆幼苗在光照下表现出去黄化表型,包括子叶变绿、顶钩展开等(图1b)。
为了探究光照对染色质结构的影响,作者对幼苗的子叶、顶钩和下胚轴组织进行了RNA测序,并在cD和cL下进行了Hi-C实验,每个处理包含两个生物学重复(图1c)。此外,我们在下胚轴组织中进行了一系列CUT&Tag实验,以研究组蛋白修饰对染色质结构的调控作用。
Hi-C热图显示,在黑暗和光照条件下,染色质相互作用主要集中在主对角线附近,并随着基因组距离的增加而递减(图1d左)。进一步构建的差异热图显示,光照条件下染色质相互作用显著增强(图1d中)。染色体内互作概率计算结果表明,子叶、顶钩和下胚轴的相互作用衰减指数(IDE)均为负值(图1d右),表明染色质相互作用随基因组距离的增加而下降,并在端粒区域有所增强(图1d左)。
图1 光在染色体水平诱导染色质重排
(a) 左:用于观察大豆光形态发生的方法,包括5种生长条件:连续黑暗(cD)、连续白光(cL)或从黑暗转到光照,然后在白光下保持1小时(D1L)、6小时(D6L)和24小时(D24L)。灰色:深色处理。白光:白光处理。右图:白光的光谱组成。
(b) 4 d龄Wm82大豆在cD、D1L、D6L、D24L和cL条件下的形态比较。
(c) 采用RNA-seq、Hi-C和CUT&tag三种基因组方法对子叶、顶钩和下胚轴进行了研究。
(d) 在cD和cL条件下,使用染色质相互作用频率在100 kb分辨率下描述了下胚轴的全基因组染色质结构。左:通过比较cD和cL条件计算的全基因组Hi-C相互作用热图。对角线值设置为0。中间:将cD处理的触点与cL处理的触点排除后剩余的触点产生差分触点,以log2比率矩阵表示。右图:所有大豆染色体随着基因组距离的增加接触概率的平均缩放图。
亚区室模式反映了转录景观
空间染色体区室化在动植物中既保守又存在差异。研究表明,每条染色体可分为活跃的compartment A 区室(常染色质)和非活跃的 compartment B(异染色质)。通过PCA对Hi-C数据进行分析,识别出A和B compartment,并观察到 A/B compartment内部的染色质相互作用更强(图2a)。在光照条件下,compartment B的相互作用增强(图2a),导致整个染色体臂的染色质相互作用增加(图2b)。尽管PCA 可区分compartment A/B,但其在高分辨率下注释染色质状态的能力有限(图2c),因此需要更精细的方法。
图2 大豆染色体中存在常染色质区和异染色质区
(a) 染色质区隔化的鞍型结构(左,中)和差异鞍型结构(右),比较在cD和cL下鉴定的染色体臂内的顺式染色质相互作用。差异鞍形图(右),紫色表示与cD处理的样品相比,cL处理的样品中相互作用更多。
(b) cD和cL处理的20条染色体的区室强度。区室强度评分由A-A和B-B相互作用数除以A-B相互作用数计算。
(c) 恒定暗处理下胚轴的16号染色体的亚室分布。第7条和第8条轨道:cD和cL期间整个染色体上A和B亚室的景观分别显示为红色和蓝色条。
通过Calder 算法,作者在黑暗和光照条件下的每种组织中鉴定出八种亚区室,包括 compartment A的四种 A sub_compartment(A.1.1、A.1.2、A.2.1 和 A.2.2)及 B sub_compartment(B.1.1、B.1.2、B.2.1 和 B.2.2)(图2c,图3a)。以cL条件下下胚轴的16号染色体为例,A sub_compartment主要分布于常染色质区域,B sub_compartment则集中于近着丝粒异染色质区域,这一现象与 H3K4me3、RNAPII Ser2P、H3K27ac 和 H3K27me3 在常染色质的富集,以及 H3K9me2 在近着丝粒高重复序列区域的修饰一致(图2c)。
RNA-seq 分析显示,A sub_compartment的转录活性显著高于B sub_compartment,并且各个亚区室的转录水平依次递减(A.1.1-B.2.2),这一趋势在所有组织样本中均保持一致(图3d)。此外,A和B sub_compartment的大小主要集中在80-90 kb之间,较大的结构域主要出现在A.1.1亚区室中(图3b、3c)。不同组织中A sub_compartment的比例存在差异,其中子叶中A sub_compartment的占比高于胚钩和下胚轴(图3a)。
进一步分析发现,光照诱导了亚区室的转换,包括A-to-B和B-to-A的变化。在黑暗向光照的过渡过程中,这种转换在所有三种组织中均被观察到,但胚钩和下胚轴的转换事件多于子叶(图3e)。基因表达水平分析显示,B-to-A转换的基因组区域中,基因的表达水平高于A-to-B转换的区域(图3f)。基因表达热图进一步表明,大多数基因在光形态建成过程中持续激活(图3g),其中B-to-A转换的sub_compartment内的光诱导基因表现出明显的组织特异性表达(图3h)。
图3 A/B 亚区的排序与大豆基因组在三种组织中的基因表达活性相关
(a)不同组织及光暗条件下亚区室比例分布
(b)黑暗处理子叶中亚区室数量分布
(c)黑暗处理子叶中亚区室结构域大小分布
(d)黑暗处理子叶中亚区室转录活性
(e)光暗转换中亚区室动态比例
(f)动态亚区室内基因表达水平
(g)B→A转换域内基因表达水平
每个光处理样品的表达值归一化到暗生长样品的表达水平。相对表达水平(z -score)在逐基因(逐行)的基础上通过减去平均值然后除以标准差计算。z分数的范围从−2到2。
(h)光诱导上调基因的组织特异性重叠
TADs存在于大豆子叶、顶钩和下胚轴中
作者使用hicFindTAD在5-kb分辨率下分析 Hi-C 矩阵的顺式互作,定义单个 TAD 为沿 Hi-C 矩阵对角线具有两个边界的绝缘三角结构域。在黑暗和光照条件下,每个组织中平均鉴定出11,066个TADs,大小范围从15 kb到60 kb(图4a)。量化不同光照条件下TAD边界的平均强度后,我们发现部分结构域在黑暗和光照条件下边界强度无显著差异,且结构域位置稳定(子叶:3,399个,胚钩:2,204个,下胚轴:2,204个)(图4b),其绝缘得分在两种条件下高度相似,因此被定义为保守TADs。然而,部分TADs在光刺激下形成(子叶:91个,胚钩:147个,下胚轴:87个),表现为光照下边界强度增加(图4d左);另一些TADs在光照后消失(子叶:320个,胚钩:219个,下胚轴:582个),表现为边界强度下降。对这两组TADs进行绝缘得分分析的结果进一步支持了这一发现(图4d右)。作者将这些受光调控的TADs统称为动态光依赖型TADs。此外,研究表明,大豆基因组中包含TADs的区域相比于活跃的表观遗传标记(如 H3K27ac),更富集抑制性组蛋白修饰(如H3K27me3)。作者分析了光依赖型TADs内的组蛋白修饰,发现这些区域确实含有较高水平的H3K27me3(图4e),表明光照在不同组织中通过不同机制调控TAD的形成与维持。
图4 TAD动态与三种大豆组织中的H3K27me3相关
(a) 3号染色体上1 Mb区域(3.5–4.5 Mb)的TAD结构形态,通过 Hi-C 热图快照展示其在持续黑暗(cD)和持续光照(cL)条件下的变化。
(b) 子叶在完全黑暗和光照条件下的保守 TAD 进行聚合 TAD 分析(ATA)。TAD 的堆叠分析采用 5 kb 分辨率的 Hi-C 矩阵。富集条形图表示相对于随机背景的平均绝缘值,并按从高到低的顺序排列。
(c) 子叶中动态 TAD 边界的聚合 TAD 分析(ATA)。相较于黑暗条件,光照条件下绝缘评分更高的 TAD 被定义为获得的 TAD(Gained TADs),而绝缘评分更低的 TAD 被定义为丢失的 TAD(Lost TADs)。TAD 的堆叠分析采用 5 kb 分辨率的 Hi-C 矩阵。富集条形图表示相对于随机背景的平均绝缘值,并按从高到低的顺序排列。平均绝缘值通过计算红色方块(左上角和右下角)的信号与蓝色方块(右上角和左下角)的信号比值获得。
(d) 子叶中动态 TAD 边界的绝缘评分分布。蓝色表示持续黑暗条件下的动态 TAD,绿色表示持续光照条件下的动态 TAD。获得的 TAD(Gained TADs)和丢失的 TAD(Lost TADs)分别定义为光照条件下比黑暗条件下绝缘评分更高或更低的 TAD。获得和丢失的 TAD 边界被对齐,并标记为“0”。
(e) 三种组织中获得和丢失的 TAD 相关的组蛋白修饰热图。红色和蓝色分别表示动态 TAD 相关的组蛋白修饰的富集和缺失情况。灰色表示该组蛋白修饰在统计学上既不富集也不缺失(双侧 Mann-Whitney U 检验,P > 0.05)。
TADs是通过RNA聚合酶II在光照下激活SAURs簇而构建的
研究揭示了TADs在大豆SAURs(Small Auxin-Upregulated RNAs)基因调控中的功能后果,并发现其中一个位于12号染色体13,350–14,220 kb区间的TAD(图 5a)在光照条件下表现出动态变化,特别是在下胚轴中,该结构域在光照下比黑暗条件下更加紧密。此外,在黑暗条件下该TAD覆盖着大量处于延伸状态的RNA聚合酶II(通过RNAPII Ser2P标记显示),而光照条件下RNAPII Ser2P的峰值会降低(图 5a),并且 RNAPII Ser2P 在SAURs转录起始位点(TSS)附近增加并集中,而在光照条件下则下降并分散分布(图5b)。这些数据表明,RNA聚合酶II可能通过增强的染色质互作来协调SAURs在光照条件下的转录。
进一步分析大豆基因组中的SAURs,作者发现大豆基因组共编码244个SAURs基因,其中162个(~67%)以不同大小的簇形式存在(clustered SAURs),而77个(~33%)独立分布(individual SAURs)。相比黑暗条件,光照条件下RNAPII Ser2P在蛋白编码基因和individual SAURs基因体内的富集程度更高,但其在clustered SAURs中的分布不同(图 5b)。此外,clustered SAURs在胚钩和下胚轴中随着光照时间的增加表现出下调趋势,但在持续光照下则被上调,而子叶中未观察到类似的共表达模式(图5c)。
为了验证 RNAPII 在SAURs表达及幼苗发育中的作用,作者使用flavopiridol(FVP)抑制 P-TEFb 介导的RNAPII Ser2P磷酸化,并发现FVP处理显著抑制了4天龄幼苗的发育,尤其是下胚轴伸长和根部发育(图5d),表明转录延伸的抑制影响了幼苗发育过程中下胚轴的细胞伸长。
图5 TAD 结构中包含的 SAURs 基因簇在黑暗和光照条件下存在差异
(a) 在下胚轴中识别出的 TAD(位于 12 号染色体的 13 300–14 250 kb 区间)在持续黑暗(cD)和持续光照(cL)条件下的热图。RNAPII Ser2P 在 cD 和 cL 条件下的分布情况显示在热图下方。蓝色条(TDG):串联重复基因。红色条(SAURs):小型生长素上调基因。浅蓝色条(PCGs):蛋白编码基因。
(b) RNAPII Ser2P 在 12 号染色体 13 634 172–13 876 042 bp 区间的 25 个 SAURs 基因上的分布情况。RNAPII Ser2P 在“簇状 SAURs”上的平均富集度分别以蓝色(黑暗条件)和绿色(光照条件)曲线表示。红色和粉色曲线代表背景信号,背景信号是通过在整个基因组中随机分布这些簇状 SAURs 计算得到的,分别对应 cD 和 cL 条件。转录起始位点(TSS)左侧和转录终止位点(TTS)右侧的侧翼区域长度均为 1 kb。
(c) 簇状和非簇状 SAURs 在光形态建成过程中的基因表达情况。基因表达水平以 log₂ 倍数变化(log₂foldchange)表示,范围从 -10 到 10。A-K 代表根据五种不同条件下的表达模式对 SAURs 基因进行分类的组别。热图左侧列出的是大豆 SAURs 基因 ID 及其对应的拟南芥同源基因名称。
(d) 4 天龄 Wm82 大豆幼苗在 15 μM FVP 处理下,在 cD 和 cL 条件下的形态学比较。DMSO 组:在含有 DMSO 的培养基中生长的幼苗作为对照
作者不仅观察到了SAURs簇内的染色质互作,还发现位于 46,984,580-47,109,819 区间的clustered SAURs与包含ULTRAPETALA1/2 (ULT1/2) 基因的基因组区域存在强烈的远程互作。该研究进一步揭示,在光照条件下,ULT1/2与带有 H3K27me3 标记的SAURs簇之间的染色质互作变得更加紧密(图6a)。此外,在黑暗到光照的过渡过程中,我们在全基因组范围内鉴定到数千个动态loops,这些动态环中既包括在光照下增强的环,也包括消失的环(图6b)。值得注意的是,SAURs 基因家族在动态环的锚点处富集程度最高(图6c)。作者进一步分析了动态染色质环内外的基因表达情况,结果表明,与位于动态环外的基因相比,动态环内的基因表达变异性更高(图6d)。
图6 SAURs 参与了长距离染色质互作的动态调控
(a) 12 号染色体 42–48 Mb 区域的 Hi-C 图,显示了 SAURs 基因簇(红色)和 ULT1/2(橙色)在持续黑暗(cD)和持续光照(cL)条件下的动态染色质互作。
(b) 动态长距离染色质互作的聚合峰分析(APA),包括在下胚轴中获得和丧失的染色质环。所有 20 kb 分辨率矩阵中的(染色体内)互作均被取平均值。Gained(获得):在光照条件下比黑暗条件下具有更多互作的环。Lost(丧失):在光照条件下比黑暗条件下具有更少互作的环。cD1 和 cD2:持续黑暗处理的两个重复实验。
(c) 在黑暗和光照条件下,所有环及动态环的基因富集分析。形状代表基因数量,形状的颜色表示富集得分。
(d) 不同时点的光照处理中,下胚轴基因表达变化的分布情况。位于环锚点的基因以红色标记,而非染色质环内的基因以绿色标记。