有性生殖的生物,新生命的诞生起源于受精过程。合子经过细胞分裂,母源RNA逐渐降解,合子基因组被激活,激发其全能性,然后进一步分化发育为完整个体[1, 2]。着床前胚胎的发育过程涉及非常复杂的基因转录变化。随着单细胞测序技术的发展,基于基因水平的表达定量研究已经被广泛报道。近年来,随着基于单分子长读长测序的单细胞全长转录本检测技术的发展,我们可以更全面地揭示早期胚胎发育的转录产物[3-5]。
一个多外显子基因通过可变剪接能够产生多种转录本亚型(isoform),从而产生不同功能的蛋白产物[6]。蛋白作为生物功能的关键执行者,在细胞命运和状态短期剧烈变化的胚胎发育早期,是否存在显著的isoform switch,即一个基因在不同发育阶段表达不同的isoform?对这一现象的研究将有助于更全面地解析胚胎发育的调控机制。此外,转座子(TE)在早期胚胎发育也具有关键调控作用。然而,由于其具有散布和高重复性特点,传统单细胞测序难以实现位点分辨率的分析。基于三代测序的单细胞技术能够有效解决这一问题,为对转座子在早期胚胎发育中的调控机制进行更精细的分析提供可能[7]。
2024年2月16日,广州医科大学-中国科学院广州生物医药与健康研究院联合生命科学学院范小英课题组在PLoS Biology杂志上发表了题为Single-cell analysis of isoform switching and transposable element expression during preimplantation embryonic development的论文,通过改进HIT-scISOseq技术用于小鼠着床前胚胎卵裂球的扩增测序,同时实现基因和isoform表达的绝对定量分析。
通过提取阶段差异表达的基因和isoform进行比较,研究团队鉴定到大量的isoform switch事件,尤其是在合子基因激活的早期和大量发生阶段。相应基因的GO分析表明这些基因参与重要的生物学过程,因此isoform switch在合子激活过程中存在且可能发挥重要的作用。蛋白质是生物功能的关键执行者。研究团队根据转录本对应的开放阅读框(ORF)种类将所有测到的全长转录本分为4类:complete,3-prime partial transcripts,5-prime partial transcripts,internal(图1A)。通过统计各类转录本在不同发育阶段的丰度,研究人员发现缺失了3’端终止密码子的3-prime partial transcripts特异地在卵细胞和合子中富集(图1B)。产生这类转录本对应的基因GO富集结果与已报道的调控胚胎发育过程中重要的生物学过程高度重合[8]。研究人员挑选了Ncl基因为代表进行详细的分析和验证,确认了该基因在母源转录组中大量表达多种3-prime partial transcripts,而合子基因激活之后全长类型上调并占据主导(图1C-E)。
图1:3-prime partial transcripts在母源RNA中显著富集。(A)转录本分类示意图;(B)各类转录在不同时期的占比分布;(C)Ncl基因检测到的转录本;(D)各类Ncl转录本丰度变化;(E)Ncl基因3-prime partial transcripts验证。
此外,借助PacBio HiFi测序的高准确度和长读长特性,研究团队实现了对单位点分辨率TE表达的定量分析,能够在单个细胞中能够检测到数千个转录的TE拷贝。值得注意的是,在合子和囊胚时期,细胞中TE表达的位点多于其前一时期,表明TE调控早期全能性与多能性基因激活(图2A)。通过对比家族水平的TE表达和单位点的TE表达变化,研究团队鉴定出MERVL这类调控核合子基因激活的元件在晚期二细胞发生广泛的低水平激活(图2B)。与非临近基因相比,TE与其临近基因的表达呈显著相关性,进一步证实了TE对其临近基因的转录调控作用(图2C)。
图2. 位点特异TE的表达分析。(A)每个细胞检测到TE表达的位点数;(B)各TE家族总体表达水平和位点表达水平统计;(C)TE与邻近和非临近基因的表达相关性。
综上,该研究通过优化单细胞全长转录本测序技术实现转录本和位点分辨率TE元件的定量分析,揭示了isoform switch以及TE对于早期胚胎发育合子基因激活的重要作用。这一研究显著加深了我们对早期胚胎基因转录调控的理解,为进一步地揭示胚胎早期发育的分子机制提供新的参考。
广州医科大学-中国科学院广州生物医药与健康研究院联合生命科学学院特聘教授、广州国家实验室范小英研究员为论文通讯作者,中山大学中山眼科中心助理研究员王朝阳博士和石卓兴博士为共同第一作者,研究受到中山大学中山眼科中心肖传乐教授的指导和帮助。
1. Jukam D, Shariati SAM, Skotheim JM. Zygotic Genome Activation in Vertebrates. Dev Cell. 2017;42(4):316-32. Epub 2017/08/23. doi: 10.1016/j.devcel.2017.07.026. PubMed PMID: 28829942; PubMed Central PMCID: PMCPMC5714289.
2. Zhao LW, Zhu YZ, Wu YW, Pi SB, Shen L, Fan HY. Nuclear poly(A) binding protein 1 (PABPN1) mediates zygotic genome activation-dependent maternal mRNA clearance during mouse early embryonic development. Nucleic Acids Res. 2022;50(1):458-72. Epub 2021/12/15. doi: 10.1093/nar/gkab1213. PubMed PMID: 34904664; PubMed Central PMCID: PMCPMC8855302.
3. Fan X, Tang D, Liao Y, Li P, Zhang Y, Wang M, et al. Single-cell RNA-seq analysis of mouse preimplantation embryos by third-generation sequencing. PLoS Biol. 2020;18(12):e3001017. Epub 2020/12/31. doi: 10.1371/journal.pbio.3001017. PubMed PMID: 33378329; PubMed Central PMCID: PMCPMC7773192.
4. Qiao Y, Ren C, Huang S, Yuan J, Liu X, Fan J, et al. High-resolution annotation of the mouse preimplantation embryo transcriptome using long-read sequencing. Nat Commun. 2020;11(1):2653. Epub 2020/05/29. doi: 10.1038/s41467-020-16444-w. PubMed PMID: 32461551; PubMed Central PMCID: PMCPMC7253418.
5. Berrens RV, Yang A, Laumer CE, Lun ATL, Bieberich F, Law CT, et al. Locus-specific expression of transposable elements in single cells with CELLO-seq. Nat Biotechnol. 2021. Epub 2021/11/17. doi: 10.1038/s41587-021-01093-1. PubMed PMID: 34782740.
6. Lebrigand K, Magnone V, Barbry P, Waldmann R. High throughput error corrected Nanopore single cell transcriptome sequencing. Nat Commun. 2020;11(1):4025. Epub 2020/08/14. doi: 10.1038/s41467-020-17800-6. PubMed PMID: 32788667; PubMed Central PMCID: PMCPMC7423900.
7. Lanciano S, Cristofari G. Measuring and interpreting transposable element expression. Nat Rev Genet. 2020;21(12):721-36. Epub 2020/06/25. doi: 10.1038/s41576-020-0251-y. PubMed PMID: 32576954.
8. Xue Z, Huang K, Cai C, Cai L, Jiang CY, Feng Y, et al. Genetic programs in human and mouse early embryos revealed by single-cell RNA sequencing. Nature. 2013;500(7464):593-7. Epub 2013/07/31. doi: 10.1038/nature12364. PubMed PMID: 23892778; PubMed Central PMCID: PMCPMC4950944.