2025.11.05
在生命科学研究中,空间组学技术可以在组织的原始位置上观察基因和蛋白的分布,是新的研究利器。然而,该领域技术平台多样、数据类型复杂,导致一个核心难题:缺乏一个统一的分析框架,能够跨平台、跨数据类型地构建精准的单细胞表达矩阵。这就像拥有多把锁和钥匙,却无法打开同一扇门,严重阻碍了数据的整合与深度挖掘。
为解决这一瓶颈,华大生命科学研究院李美团队推出CellBin。该工具旨在提供一个真正通用且可扩展的解决方案,将多来源的空间组学数据,高效、准确地转化为可直接用于下游分析的单细胞级“基因表达地图”。

文章预印页面

CellBin的整体框架及应用
a 以表达矩阵、图像为输入,可以获取单细胞表达矩阵、细胞分割mask等;b-e CellBin的主要流程及可选工具:通过图像拼接、空间图谱配准、组织/细胞核分割,最终实现单细胞级空间基因表达谱构建; f-i(左:原始图像|右:CellBin分析结果): Visium HD小鼠肺组织、Xenium人肺癌样本、Stereo-seq拟南芥种子; j Stereo-cell 人PBMC样本:UMI热图 vs CellBin解析对比; k-l Stereo-CITE 小鼠肝脏 细胞注释及UMAP 可视化展示; m 特定蛋白空间分布;n 血管区域高分辨率展示;o 细胞分割表达谱;p 蛋白分布图谱
/CellBin如何解决复杂问题/
CellBin的强大能力源于其对三个关键分析环节的优化与整合:
精准的多视野图像拼接:针对高通量技术将组织切成数千个微小视野成像的特点,CellBin能将所有小图高效高精度拼接成一幅完整的组织全景图,消除拼接错位,为后续分析奠定可靠的空间基础。
适应多模态成像的细胞分割:面对H&E、荧光等多种染色技术,CellBin集成了经过优化的细胞分割模型,能够精确识别细胞的边界,从而将分子信号准确地归属到单个细胞中。
高效高通量计算架构:针对空间数据量庞大的挑战,CellBin优化了计算流程,显著提升了大数据处理效率,使分析厘米级大样本成为常规操作。
/广泛验证,性能卓越/
CellBin的强大通用性与准确性已在多平台、多物种、多组织类型的数据中得到充分验证。在关键的量化指标上,如细胞分割的F1分数、细胞尺寸测量的准确性以及分子注释的可靠性,CellBin的表现均全面优于现有的七种主流方法。
具体应用场景展示:
精准勾勒组织结构:在小鼠肺切片中,清晰恢复肺泡等精细结构的轮廓边缘。
清晰界定肿瘤区域:在人类肺癌样本中,准确识别并将肿瘤组织分类为一个独立的单元。
破解植物样本难题:在拟南芥种子中,不仅能区分坚韧的细胞壁,还能重建子叶和根茎的完整形态。
融合多组学信息:在小鼠肝脏数据中,成功整合转录组和蛋白组,发现TER119蛋白在无核红细胞区域高表达,而该区域基因信号沉默——这一发现清晰地揭示了蛋白与基因表达的不一致性,凸显了多组学整合分析的巨大价值。

CellBin的性能评估
a 放大图像中拼接误差的示例(以像素为单位),10个像素的错位大约相当于半个细胞的大小;b 在公共数据集上,MIST、ASHLAR和MFWS(本文方法)所产生的相对误差比较;c 条形图展示了MIST、ASHLAR和MFWS在各数据集上产生的最大累积拼接误差;d 折线图显示了MIST、ASHLAR和MFWS在Stereo-seq小鼠脑数据集上的运行时间;e 512x512像素的ssDNA染色数据示例。第一幅为原始图像,第二幅为人工标注的真实值,后续图像展示了不同方法的细胞分割结果;f, g, h, i, j 针对ssDNA示例数据,分别展示了不同方法的AJI(聚合杰卡德指数)、F1分数、边界F1分数、细胞大小评估和计算资源使用情况; k, l 展示了在482套图像集上评估的F1分数和Dice系数; m 图示了CellBin在1cm×1cm、1cm×2cm和2cm×3cm芯片尺寸上的CPU内存使用量、GPU内存消耗和处理时间;n 展示了使用CellBin和Cellpose对完整小鼠脑切片进行cell2location注释的结果;o 左图和中图分别提供了第三个脑区在CellBin和Cellpose下的放大视图;右图描绘了Allen小鼠脑图谱中的对应区域;p 比较了两个不同区域中的细胞比例;q 展示了使用两种工具在整个小鼠大脑中得到的cell2location定位分数;r 可视化展示了经CellBin处理后的整个小鼠大脑的大脑皮层;s, t 分别提供了SSp皮层的放大视图及其邻近区域分析z-score 对比。
CellBin的推出,是空间组学数据分析迈向标准化和可重复性的关键一步。它提供了便捷的格式转换工具,支持Stereo-seq等主流平台数据的无缝接入。其模块化设计也赋予用户高度的灵活性,可根据具体需求选择不同的分析模块。
作为一个在单细胞水平处理空间组学数据的通用框架,CellBin精准地回应了该领域对“更多组学、更大视野、更多平台”统一分析工具的迫切需求。它不仅在同台竞技中展现出卓越的性能,更在下游的细胞注释分析中提供了更清晰、可靠的结果。随着空间组学的持续发展,CellBin有望成为支撑重大生物学发现的基础性工具,赋能发育、疾病、神经科学等多个前沿领域的探索。
论文链接|立即体验CellBin|CellBin github