Advances in spatial transcriptomic data analysis
题目: 空间转录组学数据分析研究进展
DOI: https://doi.org/10.1101/gr.275224.121 (opens new window)
Cite:Dries R, Chen J, Del Rossi N, Khan MM, Sistig A, Yuan GC. Advances in spatial transcriptomic data analysis. Genome Res. 2021 Oct.
Pubmed:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC9643508/ (opens new window)
作者介绍:
Ruben Dries |
---|
Department of Medicine, Boston University School of Medicine, Boston, Massachusetts 02118, USA |
ruben.dries@bmc.org |
# Abstract:
空间转录组学是一个快速发展的领域,有望以单细胞或亚细胞分辨率全面表征组织组织和结构。这些信息为理解健康和疾病中的许多生物过程提供了坚实的基础,而这是使用传统技术无法获得的。计算方法的发展在从原始数据中提取生物信号方面发挥着重要作用。人们已经开发了各种方法来克服特定技术的限制,例如空间分辨率、基因覆盖度、灵敏度和技术偏差。下游分析工具将空间组织和细胞间通信制定为可量化的属性,并提供算法来导出这些属性。集成pipelines进一步将多个工具组装在一个包中,使生物学家能够从头到尾方便地分析数据。在这篇综述中,我们总结了空间转录组数据分析方法和pipelines的最新技术,并讨论了它们如何在不同的技术平台上运行。
# Results:
# Figure 1: Data sets used in this Perspective.
Figure 1. 本文中使用的数据集。
# Figure 2: Preprocessing of raw spatial transcriptomic data.
Figure 2. 原始空间转录组数据的预处理。
(A) 对于与图像配对的空间转录组数据,处理从校正和拼接多个捕获或视场 (FOV) 开始,以形成清晰的合成图像。
(B) 记录来自同一组织的多个堆叠切片的图像,并将所得空间变换映射回转录组数据,以创建对齐的 3D 基因表达数据集。
(C) 存在多种方法来提供具有空间信息的表达数据。对于 FISH 和 ISS 等没有明确定义的spot或边界的技术,需要进行细胞分割(上图),以便将读取分配给各个细胞。另一方面,原位捕获或基于阵列的方法(下图)根据每个空间单元(例如spot)特有的空间条形码将读数分配给读数点。
# Figure 3: Overview of spatial transcriptomics analysis methods. A variety of analyses can be performed on spatial transcriptomics data.
Figure 3. 空间转录组学分析方法概述。可以对空间转录组学数据进行各种分析。
(A) 对图像本身进行分析,范围从细胞分割等早期任务到通过细胞形状和大小分类支持亚细胞分析。
(B) 通过聚类和注释来识别细胞类型。
(C) 执行与外部scRNA-seq数据的额外集成或覆盖多个细胞的空间单元的反卷积,以微调细胞类型映射。
(D) 计算细胞类型的空间分布。
(E) 计算细胞类型的细胞间通信。
(F) 根据基因表达信息和空间坐标识别和可视化空间表达模式。
(G) 细胞分辨率的数据可用于识别单个细胞内转录本的空间和时间动态。
# Figure 4: Strategies for cell type identification with spatial transcriptomic data.
Figure 4. 利用空间转录组数据识别细胞类型的策略。
(A) 单细胞分辨率的空间转录组数据可直接用于以与 scRNA-seq 类似的方式识别细胞类型。此外,还可以集成来自匹配组织的外部 scRNA-seq,以增加可用特征的数量并帮助识别检测到的细胞类型。
(B) MERFISH 小鼠冠状脑切片数据集显示了细胞类型注释的示例。每个点代表一个细胞,颜色表示通过聚类识别的不同细胞类型。放大的子集以更高分辨率显示空间细胞类型组成。
(C) 非单细胞空间转录组数据中的细胞类型通过利用外部信息的反卷积方法或通过使用已知标记基因组或 scRNA-seq 信息的基因富集策略来识别。
(D) 人类心脏 10x Genomics Visium 数据集中两种细胞类型的富集分数叠加在感兴趣区域内的点的顶部。
(E) 饼图描绘了D中使用的每个选定点内已识别细胞类型的比例。
# Figure 5: Spatial pattern analyses.
Figure 5. 空间模式分析。
(A) 相邻细胞类型的空间分布分析。网络表示发现两种细胞类型彼此非常接近的可能性。
(B) MERFISH 小鼠冠状脑切片数据集中的细胞子集显示了不同细胞类型之间的空间网络连接性和细胞邻近性。
(C) 在单细胞水平上,可以根据目标细胞(黄色)及其直接相邻细胞(蓝色)来识别细胞生态位。
(D) 源细胞和邻近细胞在 MERFISH 小鼠冠状脑切片数据集的一小部分中进行了描述。
(E) 基于空间基因表达信息的模式基于单个或多个基因,并且是连续的(顶部)或离散的(底部)。
(F) 右侧显示了 MERFISH 小鼠大脑冠状数据集中具有独特空间连贯表达模式的单个基因。
# Figure 6: Schematic diagram for spatial transcriptomics analysis at subcellular resolution.
Figure 6. 亚细胞分辨率的空间转录组学分析示意图。
(A) 对于亚细胞分辨率的空间数据,每个点通常代表一个转录本,或者代表一个远低于细胞大小的空间单位。
(B) 每个转录本的位置及其基因身份可以用作输入来尝试分割每个细胞。
(C) 单个转录本可以与其他转录本(橙色和蓝色)或自身(绿色)共定位,或者可以在特定的亚细胞结构中找到(膜上的粉红色)。
(D) 可以从转录本的位置推断出单个或多个基因的转录动态。此处,新生转录本通常存在于细胞核中(蓝色),而加工后的转录本则存在于细胞质中(橙色)。两者之间的比率可以提供 RNA 速度的估计。每个图的右侧都提供了使用小鼠体感皮层的 seqFISH+ 数据集进行分析的示例。
# Figure 7: Cellular communication inferred from ligand–receptor interactions.
Figure 7. 从配体-受体相互作用推断细胞通讯
首先使用其基因表达谱探索已知的配体-受体相互作用对,然后将其传递给计算工具以生成通信分数,该分数解释每种细胞类型之间和内部的连接性,如 A所示。可以使用不同细胞类型之间的这些分数构建空间图,如B和C所示。
# Figure 8: Schematic diagram for spatial transcriptomics analysis at subcellular resolution.
Figure 8. 交互式探索性分析管道概述。具有多个选项的集成和交互式管道可用于分析空间数据集。
(A) 空间数据分析从导入和处理原始数据集开始。
(B) 为基于图像的分析。
(C) 基于基因表达的分析。基于细胞分割和形态量化等图像的分析可用于研究组织选定部分中的细胞复杂性。基于基因表达的分析由多种方法组成,例如聚类、空间网络构建和细胞类型富集,以可视化基因表达模式。交互式图形界面使新手用户更容易使用这些方法。
# Discussion:
近年来,根据转录组图谱对细胞类型进行分类,有时还辅以其他分子模式,从而发生了范式转变。由于ST技术的快速发展,现在可以对同一细胞进行转录组分析和形态分析,从而为系统地研究这两种根本不同的方法之间的关系提供了很好的机会。这里没有涉及的一个令人兴奋的新方向是空间多组学。新技术的发展使得在保留蛋白质和RNA等信息的同时分析同一细胞中的多种形态信息成为可能、内含子和成熟 mRNA、DNA 和 RNA。总之,空间技术带来了许多新的挑战和机遇。我们相信,通过为新数据的分析、可视化和解释提供重要工具, 计算方法的开发将继续在将空间技术的前景转化为现实方面发挥关键作用。