Inferring ligand-receptor cellular networks from bulk and spatial transcriptomic datasets with BulkSignalR
题目: 使用 BulkSignalR 从 bulk 和空间转录组数据集中推断配体-受体细胞网络
DOI: https://doi.org/10.1093/nar/gkad352 (opens new window)
Cite:Jean-Philippe Villemin, Laia Bassaganyas, Didier Pourquier, Florence Boissière, Simon Cabello-Aguilar, Evelyne Crapez, Rita Tanos, Emmanuel Cornillot, Andrei Turtoi, Jacques Colinge, Inferring ligand-receptor cellular networks from bulk and spatial transcriptomic datasets with BulkSignalR, Nucleic Acids Research, Volume 51, Issue 10, 9 June 2023.
Pubmed:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC10250239/ (opens new window)
作者介绍:
Jacques Colinge |
---|
Institut de Recherche en Cancérologie de Montpellier (IRCM), Inserm U 1194, Montpellier, France |
jacques.colinge@umontpellier.fr |
# Abstract:
由于单细胞组学,配体-受体相互作用介导的细胞网络的研究最近引起了广泛的关注。然而,伴随着临床信息的大量 bulk 数据的丰富集合已经存在并继续产生,迄今为止单细胞中还没有类似的数据。与此同时,空间转录组(ST)分析代表了生物学中的革命性工具。许多 ST 项目依赖于多细胞分辨率,例如 Visium™ 平台,在每个位置分析多个细胞,从而产生本地化的 bulk 数据。在这里,我们描述了 BulkSignalR,这是一个 R 包,用于从 bulk 数据推断配体-受体网络。BulkSignalR 将配体-受体相互作用与下游通路整合以估计统计显着性。一系列可视化方法补充了统计数据,包括专用于空间数据的功能。我们使用不同的数据集(包括新的 Visium 肝转移 ST 数据)以及蛋白质共定位的实验验证来证明 BulkSignalR 相关性。与其他 ST 软件包的比较表明 BulkSignalR 推断的质量明显更高。由于其内置的通用直系同源映射功能,BulkSignalR 可以应用于任何物种。
# Results:
# Figure 1: BulkSignalR overview.
Figure 1. BulkSignalR 概述
(A) 具有受体下游通路的 LRI 模型。与受体相关的通路活性由靶基因(蓝色)报告,其中包括受体复合物的其他成员(用 C 表示)和调节基因(用 Re 表示)。
(B) BulkSignalR 输出示例。
(C) 受体水平和最佳途径水平的还原操作示例。还可以进行其他还原操作。
(D) 代表性伪 ROC 曲线,显示在不同深度使用通路信息的效果(深度随着百分位数的减小而增加)。
(E) 当样品显示细胞组成存在明显差异时,简单单细胞启发评分的表现。我们考虑了集群 A与. B 方程M000102C 和 A 与 B 相比,寻找与 (A) 或两个方向的随机表达数据相比得分增加的情况。
(F) L-R 通路三元组的基因特征构建原理以及 z 分数加权平均值的计算(左)。可以在样本之间比较多个 L-R 通路特征分数,例如在热图中(右)。
(G) 在 BulkSignalR 中,参考数据库源自人类,但集成的直向同源映射工具允许将其用于几乎任何物种。
(H) 仅限于所选途径(SDC 数据集中的 PD-1 信号传导)的 LRI 的图形显示示例。
(I) 所选途径(SDC 数据集中的 PD-1 信号传导)的 LRI 的表示,具有到达目标基因的最短路径。
# Figure 2: Bulk data analysis with BulkSignalR.
Figure 2. 使用 BulkSignalR 进行 bulk 数据分析
(A) DepMap 肺癌细胞系数据集中的自分泌通讯。分析是在 LRI 级别进行的。
(B) 不同发育和成年生命阶段的人脑和心脏样本的转录组数据分析(通路水平)。
# Figure 3: Assigning cell types to interactions.
Figure 3. 将细胞类型分配给相互作用
(A) 使用细胞类型的基因特征得分和 LRI 的基因特征得分,建立数学模型来根据最小的细胞类型得分集预测 L–R 得分。
(B) 对于 SDC 数据集,我们表示每种细胞类型对 LRI(网络)贡献的总权重。左:大多数循环通路仅与成纤维细胞和内皮细胞之间的 LRI 相关。右:大多数仅在免疫细胞类型之间相互作用的循环途径。
(C) 免疫荧光支持的 SDC 中的相互作用和细胞类型 和 BulkSignalR 预测。
(D) 合成数据的细胞类型关联算法的真阳性率 (TPR) 和真阴性率 (TNR)。
# Figure 4: BulkSignalR for spatial transcriptomic data analysis.
Figure 4. BulkSignalR 用于空间转录组数据分析
(A) TNBC 组织的空间组织。DCIS 代表导管原位癌。
(B) 与基质相关的重要 LRI 示例。
(C) 与细胞凋亡的癌症侵袭组织相关的 LRI 示例。
(D) 使用指定数据集指定工具的计算时间。
(E) TNBC 数据集中重要 LRI 的数量。
(F) 组织区域与配体和产物捕获的受体的伴随表达之间的统计关联L * R产生 Q 值
(G) 整个组织中配体和受体之间的斯皮尔曼相关性。
(H) HER2 +乳腺癌数据集中显着 LRI 的数量。
(I,J) HER2 +乳腺癌数据集 与 (F,G) 相同。
(K) 背外侧前额皮质数据集中重要 LRI 的数量。
(L,M) 皮质数据集 与 (F,G) 相同。
# Figure 5: BulkSignalR analysis of a colorectal liver metastasis (CRC-LM) ST dataset.
Figure 5. 结直肠肝转移 (CRC-LM) ST 数据集的 BulkSignalR 分析
(A) 三个 CRC-LM 样本的架构。
(B) 三个 CRC-LM 中有七个丰富的 EGFR 配体。DCN与EGFR呈负相关。UBA52-EGFR 被认为是可疑的 LRI 并被忽略。
(C) CRCLM1 中四种最丰富的配体-EGFR 相互作用(基因特征评分)的空间分布以及EGFR、CDH1和DCN的表达。
(D) CRCLM2 中三种最丰富的配体-EGFR 相互作用的空间分布。
(E) CRCLM3 中代表性 LRI 空间分布。
# Figure 6: IF analysis of selected ligand-receptor interactions in CRCLM1.
Figure 6. CRCLM1 中选定配体-受体相互作用的 IF 分析
(A)(左)CRCLM1 的结构概览,其中包含基质区域(白色)和 EGFR +癌细胞(绿色)。(右)促纤维增生和坏死区域的高倍放大视图。
(B) CDH1-EGFR 和 CDH1-cMET 相互作用的分析。
(C) DCN-EGFR 和 DCN-cMET 相互作用的分析。