CellTag 单细胞谱系追踪技术

研究背景

得益于单细胞技术的快速发展,我们如今能够对大量单个细胞的身份特征(identity)和状态特征(state)进行多维解析,从而构建高分辨率的细胞图谱。自问世以来,单细胞RNA测序(scRNA-seq)技术已成为单细胞分析的主流工具。早期的scRNA-seq方法通量相对较低,直到微流控技术的突破使细胞捕获率实现了数量级提升。当前的技术发展正逐步突破物理隔离单细胞的传统限制,在提升捕获效率的同时显著降低成本。

除高通量scRNA-seq外,染色质可及性的单细胞检测(scATAC-seq)技术及其与转录组同步捕获方也已实现。新兴的计算方法则进一步推动了这类多组学数据的整合分析。这些技术进步共同推动了对细胞群体异质性的深度解析,在多种生物系统中揭示了稀有细胞类型及其动态状态。

然而,现有技术存在重要局限:细胞获取通常需要组织解离,这一过程会导致关键的空间分布、时间动态和谱系关系信息丢失。谱系层级的构建能够揭示细胞潜能、身份特征及行为模式等关键信息。CellTag 是一种基于高通量单细胞测序的细胞标记技术,通过基因编辑或病毒载体在细胞中引入独特的DNA条形码(CellTag),实现对单个细胞及其子代的长时程追踪。该技术由Morris实验室于2018年首次在Nature Biotechnology发表。

技术简介

为了给细胞打上可遗传的条形码标记以便后续识别,该技术使用携带GFP和SV40 polyA信号序列的慢病毒转导成纤维细胞,其中GFP表达由最小化的巨细胞病毒(CMV)启动子驱动。这一基于pSMAL骨架的设计最初由van Galen等人开发,用于高效转导人造血干细胞。在GFP的3'非翻译区(UTR)内设计了一个8bp的随机索引序列,可以产生大量带polyA尾的mRNA条形码,从而能够通过高通量单细胞RNA测序平台并行捕获谱系信息和细胞身份特征。通过这种方法构建的复合文库中,每个慢病毒颗粒可携带多达65,536种独特的CellTag。初始细胞群体以感染复数(MOI)>1的条件进行转导,确保每个细胞都能获得多个CellTag标记。这种组合条形码策略使细胞获得永久且可遗传的独特CellTag"特征"。为了实现谱系树重建,需要创建带索引的文库来支持细胞的序贯标记,从而绘制谱系关系图。这种灵活的标记方法能够在细胞命运转换过程中纵向追踪谱系和身份特征,阐明决定特定转化轨迹的分子调控机制,并鉴定出能够增强重编程效率的关键因子。

实验流程

CellTag技术工作流程

图1 | CellTag技术工作流程

a. CellTag标记流程示意图

通过慢病毒载体在GFP报告基因的3'非翻译区(UTR)插入8bp随机"CellTag"条形码,后接SV40 polyA信号序列。采用复合质粒文库转染HEK293T细胞生产慢病毒文库后转导目标细胞,使每个细胞表达约3-4个独特CellTag,形成可遗传的细胞特异性标记,从而在实验过程中追踪具有克隆关系的细胞群。

b. 多重标记的载体设计

在可变CellTag区域前插入6bp短索引序列,支持不同轮次的标记结果解卷积,进而构建谱系树。该设计包含以下关键元件:

  • CMV最小启动子:驱动GFP-CellTag融合表达
  • 6bp索引序列:区分不同标记轮次(V1/V2/V3)
  • 8bp随机条形码:生成65,536种独特组合

c. 实验方案示例(小鼠胚胎成纤维细胞重编程)

通过逆转录病毒递送Foxa1/Hnf4α诱导MEFs重编程为iEPs过程中:

  • 初始标记(D0):成纤维细胞状态转导CellTagV1
  • 次级标记(D3):重编程启动后72小时转导CellTagV2
  • 终末标记(D13):重编程第13天转导CellTagV3

每3-7天收取部分细胞进行单细胞RNA测序,其余细胞继续传代培养。

d. 基于力导向图的谱系重建

  • 节点:代表2,199个独立细胞
  • :表示细胞间克隆关系
  • 颜色编码
    • 紫色(CellTagV1克隆)
    • 蓝色(CellTagV2克隆)
    • 黄色(CellTagV3克隆)

该可视化结果展示克隆群体随重编程进程的动态演变,揭示早期命运决定与晚期分化轨迹的关联性

应用案例:造血系统细胞的命运预测

Lin⁻Sca-1⁺c-Kit(LSK)细胞是一种存在于骨髓中的细胞群体,其名称来源于细胞表面标志物的表达情况。具体而言,"Lin⁻"表示这些细胞不表达成熟血细胞的谱系标志物,而"Sca-1⁺"和"c-Kit⁺"则是造血干细胞和祖细胞的典型标志物。LSK 细胞群体包含了造血干细胞(HSC)和多能祖细胞(MPP)。其中,HSC 具有自我更新的能力和分化为所有血液细胞类型的潜力,而 MPP 则主要负责短期内的快速分化、生成特定的血液细胞谱系。因此,LSK细胞群体在研究造血系统的分化机制和干细胞命运决定的过程中具有重要意义。

在实验设计中,研究人员首先从骨髓中分离出 LSK 细胞,并采用 CellTag 技术对细胞进行标记。分离后的 LSK 细胞在体外适宜条件下培养 2.5 天后,收集一部分祖细胞用于测序;剩余的细胞则继续培养至第 5 天,以获得更晚期的细胞状态,再进行测序分析。本研究中生成的数据集(GSE216521)包含两种关键类型的单细胞测序数据:

  1. 单细胞 RNA 测序(scRNA-Seq):细胞的基因表达矩阵,其中行代表基因,列代表的细胞,矩阵中的值为每个基因在特定细胞中的表达水平。
  2. 单细胞染色质可及性测序(scATAC-Seq):染色质开放性矩阵,其中行代表染色质区域,列代表细胞,矩阵中的值为每个区域在特点细胞中的开放程度。
造血细胞早期状态与命运分析

图2 | 利用CellTag技术分析造血细胞早期状态与命运
e.细胞分化轨迹的UMAP图
g.各谱系克隆细胞群体分布
l.识别命运决定的关键基因及转录因子

相关文献

  • Biddy, B.A. et al. (2019). A single-cell molecular map of mouse gastrulation and early organogenesis. Nature Protocols 14, 3894–3942. Nature Protocols Article
  • Morris, S.A. et al. (2023). Clonal dynamics in early human embryogenesis inferred from somatic mutation. Nature Biotechnology 41, 1453–1462. Nature Biotechnology Article