中文

English

简化空间数据分析:鸿运国际的生物医疗降维聚类工具

发布时间:2025-03-14   信息来源:禄静娜

当前常用的空间转录组降维聚类方法,例如主成分分析(PCA)和非负矩阵分解(NMF),多基于单细胞数据开发,因此可能无法完全满足空间转录组数据的需求。这些常用方法往往没有充分利用空间转录组所特有的组织空间定位信息,仅以基因表达谱为依据进行聚类。然而,在生物组织中,相邻位置通常具有相似的细胞组成及基因表达水平。因此,将空间位置信息整合到降维聚类过程中,有助于更接近真实的生物状态,实现更有效的空间聚类。

简化空间数据分析:鸿运国际的生物医疗降维聚类工具

基于这一理念,鸿运国际推出了空间转录组降维聚类工具——SpatialPCA。该工具通过空间概率主成分分析(spatial probabilistic PCA),明确模拟组织位置之间的空间相关性结构,从而在降维数据中保留原始空间数据的相邻近似性。SpatialPCA将空间定位信息作为额外输入,并利用核矩阵模拟组织位置之间的空间结构。此方法产出的降维主成分由于包含相关的空间结构信息,被称为空间主成分。具体而言,该方法同时运用基因表达矩阵和位置信息矩阵,将基因表达矩阵构建为潜在因子的函数模型,并根据位置信息矩阵对潜在因子构建核矩阵,以明确潜在因子的空间结构相关信息。

在模拟数据研究中,研究团队选择了背外侧前额叶皮层(DLPFC)作为数据源,通过手动分割各个皮层,确定了10000个特定细胞类型的空间位置,并获取了这些细胞的单细胞表达数据。设计了四种不同细胞组成的模拟空间转录组数据。相较于现有的空间聚类方法(包括接受或不接受空间信息的分析工具),SpatialPCA在这些模拟数据测试中表现出了明显的检测性能优势。

在真实数据测试中,研究团队使用人类DLPFC的Visium空间转录组数据,平行测试了多种工具(如SpatialPCA、BayesSpace、SpaGCN、HMRF、stLearn、PCA、NMF)。结果表明,SpatialPCA生成的空间聚类结果在生物结构上最接近实际情况,其预测的精确性和空间域结构的连续性(CHAOS评分越低,连续性越高)在多种工具中均达到最高。

为了验证SpatialPCA的技术普适性,研究团队还在其他技术(如Slide-seq和Slide-seq V2)取得的小鼠脑组织空间转录组数据中进行了测试,结果一致显示,SpatialPCA的聚类结果与实际情况更为符合。此外,为了验证SpatialPCA的样本普适性,研究团队利用HER2阳性乳腺肿瘤样本进行测试,结果亦显示SpatialPCA具备更高的聚类精确性和更贴近实际情况的表现。

随着SpatialPCA所计算出的空间主成分同时包含空间信息和基因表达信息,研究人员可以利用此工具进行后续分析。例如,使用Slingshot对肿瘤组织的空间转录组数据进行轨迹推断,结果显示出一条从肿瘤区域指向肿瘤周围区域再到正常组织的轨迹,计算得到的伪时间相关基因富集于免疫反应、细胞介导免疫和吞噬识别通路,强调了它们在癌症进展、肿瘤侵袭及转移中的重要性。

此外,依据SpatialPCA的建模框架,研究人员能够在新的空间位置推断基因表达水平,同时也可以通过低分辨率样本数据构建高分辨率的空间图谱。针对肿瘤组织的测试显示,SpatialPCA所构建的高分辨率空间图谱展现了连续和平滑的特征,其聚类精确定位了不同组织区域间的边界,并细化了紧邻肿瘤与免疫区域之间的薄层肿瘤周边区域,显示了SpatialPCA在精细结构解析方面的优势。

总体而言,SpatialPCA是一款十分适合用于空间转录组数据降维聚类的分析工具。如果您手上的空间数据群聚效果不尽人意,不妨尝试鸿运国际的SpatialPCA,相信能够带来意想不到的效果。