STOmics logo STOmics logo

EN
常见问答 常见问答 常见问答
常见问答
搜 索
筛选项目 清除选项
时空产品
时空转录组FF
时空转录组FF
时空转录组FF兼容mIF
时空转录组FFPE
时空转录组大尺寸芯片
时空蛋白转录组Stereo-CITE
分析工具
技术流程
实验准备
透化实验
转录组实验
文库构建
测序
数据分析
17条搜索结果:
Q 华大时空组学技术Stereo-seq配套的线下分析软件ImageQC/Imagestudio、SAW以及StereoMap 使用时有哪些注意事项? 展开 收起
A

需要注意:一、新版本软件可兼容旧版本功能;二、三个软件必须配套使用,即软件的不同版本号之间需要配套。现有不同版本号间的配套规则如下:

imageQCImageQC描述SAWSAW描述

<= 1.0.8文件格式:.json + .tar.gz描述:ssDNA图像QC<= 4.1.0支持组织分割和ssDNA图像配准

>= 1.1.0文件格式:.ipr + .tar.gz描述:ssDNA图像QC>= 5.1.3支持ssDNA图像细胞分割;支持Q4 FASTQ数据分析

ImageStudioImageStudio描述SAWSAW描述StereoMapStereoMap描述
1.0文件格式:.ipr + .tar.gz描述:ssDNA图像QC及手动处理>= 5.5支持ssDNA图像细胞分割;支持Q4 FASTQ数据分析;1支持空间表达热图展示;基因分布megre展示;ssDNA图展示及手动配准;
2.0文件格式:.ipr + .tar.gz描述:ssDNA、DAPI、mIF图像QC及手动处理>= 6.0支持mIF配准;支持rRNA过滤2mIF图展示;mIF图merge展示;
2.1文件格式:.ipr + .tar.gz描述:ssDNA、DAPI、mIF图像QC及手动处理;及QC失败图像的全手动处理;>= 6.1< 7.0支持ImageStudio全手动处理图像接入流程;
2.1< 3.0支持多gef一次性读入,通过切换标签展示
2.2文件格式:.ipr + .tar.gz描述:ssDNA、DAPI、mIF图像QC及手动处理;及QC失败图像的全手动处理;>= 6.1< 7.0支持ImageStudio全手动处理图像接入流程;
2.1< 3.0支持多gef一次性读入,通过切换标签展示
3.0文件格式:.ipr + .tar.gz描述:ssDNA、DAPI、H&E、mIF图像QC及手动处理;及QC失败图像的全手动处理;
7count重构上线register重构,升级组织分割和细胞分割V03算法。支持H&E全流程处理支持基于细胞分割的mask图像结果,使用EDM算法进行细胞修正。<=3.0支持读入不同binsize/resolution的h5ad;cgef文件跑过SAW cellChunk模块后写入/codedCellBlock信息,加载cgef时支持渲染cellbin热图
7.1支持时空蛋白试剂盒分析,可获得蛋白表达矩阵支持蛋白组和转录组联合分析
3.1支持蛋白+转录试剂盒分析结果可视化支持主副窗分别展示不同组学,或分别展示热图和聚类图支持主副窗联动展示
已与StereoMap合并文件格式:.tar.gz(包含.ipr)
描述:ssDNA、DAPI、H&E、mIF图像QC及手动处理,以及QC失败图像的全手动处理;
8.0使用pipeline进行分析;
支持FFPE样本分析(包含微生物部分);
输出报告压缩包文件输出可视化压缩包文件;
4.0图像可视化:支持使用.stereo统领文件读取;兼容旧版本数据读取;
手动处理:使用step by step方式处理图像数据
8.1支持Stereo-seq T FF V1.3和Stereo-CITE T FF 样本分析4.1图像可视化:支持展示 Cellbin 的单/多基因热图;支持蛋白&Marker 基因的多组学联动展示;
手动处理:增加空芯片打点配准(无需矩阵);
输出文件支持用户自定义目录。


Q rRNA的比对如何在分析过程中去除?是否可以手动设置需要去除的rRNA序列? 展开 收起
A

此功能的使用需根据SAW版本进行区分。


SAW >= v8.0:

①使用SAW makeRef构建比对所需的参考基因组索引文件,若需进行rRNA去除,需要在构建时设置--rRNA-fasta参数,自动添加rRNA信息并构建索引文件。

②运行SAW count时开启--rRNA-remove参数即可,并且使用添加了rRNA信息的索引文件。

③去除rRNA的步骤细节和原理详见《SAW 用户手册》>使用教程>比对索引构建>#SAW makeRef>##转录组比对>###添加 rRNA 信息至参考基因组。



SAW < v8.0:

①可以在参考基因组FASTA文件中手动添加rRNA序列,重新构建reference index后,再在SAW运行mapping时打开rRNAremove开关,过滤掉比对上rRNA序列的reads。rRNA过滤功能在SAW v6.0版本新增。

②添加rRNA序列规则:在FASTA文件中增加待过滤的rRNA序列,“>”开头的序列名称需要在第一个部分的名称最后增加“_rRNA”,用于程序识别。示例如下:


5eecdaf48460cde597a98a21623c3e677bdf515d479ad2214e47bcdad4e608bc2bf3b0078b9fb6c839e8703ac5556d0d718780e9e3cc06fe46e1353cea9e5d502a881532c0d1bab4b2d4d47cb1cc505d08cf75a52f134f4b4bd6b5792c76823f


③运行SAW mapping时在bcPara文件中增加一行,输入"rRNAremove"。示例如下:
bcPara file

in=<mask>

in1=<lane_read_1.fq.gz>

in2=<lane_read_2.fq.gz>

barcodeReadsCount=<lane.barcodeReadsCount.txt>

barcodeStart=0

barcodeLen=25

umiStart=25

umiLen=10

umiRead=1

mismatch=1

bcNum=<CIDCount>

polyAnum=15

mismatchInPolyA=2

rRNAremov

④如果query read比对上rRNA,其比对记录第三列RNAME为参考基因组中添加了"_rRNA"尾缀的序列名称,第十二列Optional fields的XF:i标签为3。后续注释时,根据XF标签的记录,统计rRNA的比例。

微信截图_20240812174341

Q 为什么在 StereoMap 的转录组分析图层会看到两个热图? 展开 收起
A

StereoMap v4.0 版本后默认展示组织区域的热图,如果运行 SAW v8.0 软件进行分析时没有输入显微镜图像,程序会基于表达矩阵信息进行组织分割,如果分析人员对自动算法提取的组织内矩阵不满意,可能需要基于整张芯片的表达热图重新进行组织区域的圈选(使用lasso工具),故此场景下,在 StereoMap 中会看到全芯片和组织区域两个范围的转录组热图。

Q 为什么在 StereoMap lasso 前后 MID 统计信息会有部分差异? 展开 收起
A
  • 主要原因为 StereoMap lasso 统计信息与 SAW lasso 生成的矩阵计算数值的逻辑不一致:
    • lasso 的统计信息:首先判断当前圈选的区域的 sport 点是否过 bin 的中心,如果过了 bin 的中心,则统计该 bin 的信息;否则不统计。
    • SAW 提取矩阵:首先将圈选的轮廓区域转换为 bin 1 ,即最小的颗粒度,再从 bin1 转换为其它大 bin。

微信截图_20240812172554

微信截图_20240812172611

Q 在 StereoMap 中可视化查看结果时,发现自动配准的情况下,图像边界外出现基因表达现象,是否正常? 展开 收起
A

微信截图_20240812172432


这种情况是正常的,以上图为例,图为图像+矩阵热图的可视化展示,原因主要有两点:一,由于样本切片位于芯片边缘,图像组织分割结果会生成在矩阵外周,造成“外溢”的假象;二,在观察矩阵热图时通常选择bin20或者bin50(将其视为一个spot单位点)的bin size尺寸,bin的坐标位点计算是取其左上角顶点,当实际表达只占spot单位点的一小部分时,可视化展示也会将整个spot点亮,所以矩阵边缘看起来像是“外扩”。

Q SAW分析完成会产生多个GEF文件,分别记录了哪些信息?是否支持可视化? 展开 收起
A

GEF是一种分层结构的数据文件格式(本质是HDF5文件),支持灵活保存不同bin size的稠密矩阵和稀疏可视化矩阵,来适配数据存档和可视化展示的多种场景。具体每个GEF根据使用场景和频率,不一定包含可视化必需的稀疏矩阵,以降低存储压力。

  • SAW >= 8.0

    • 详细信息请查看《SAW 用户手册》>运行分析>输出结果>Matrices。

  • SAW < 8.0


微信截图_20240812172301

Q SAW分析任务如果意外中断了是否可以断点重启? 展开 收起
A

使用 SAW >= 8.0 运行SAW count分析流程时,如遇到因集群意外停机、环境kill任务或者队列爆内存情况,在重启集群/服务器后,重新提交任务,程序可以rerun分析,但是要求两次分析任务的命令参数完全一致,不可有任何更改,程序会对此进行校验,如有区别,会当成第二次不同的任务启动。

注:此功能不适用于参数设置错误,或者输入数据错误等人为因素引发的问题。

Q 一个细胞的大小和square bin size的关系是怎样的? 展开 收起
A

以一个细胞的直径为10 μm左右计算时,一个细胞约相当于bin20(10 μm x 10 μm)或 bin14(取diagonal = 10 μm)。

Q Bin是方形区域还是指圆形区域?分析时如何选择合适的Binsize? 展开 收起
A

Bin是芯片上规整的N × N的方形区域,区域内表达信息汇总就是Bin的表达信息,注意不包含正方最右侧边和最下方边的DNB点(Bin1除外)。

可以按照不同组织类型的细胞大小等,根据下游分析效果多次调试Bin20、50、100、200数值。其中Bin20与动物细胞大小近似,Bin50和Bin100是常用于分析的Binsize大小,Bin200一般用于快速可视化效果展示。

Q Valid CID比例异常应该怎么处理? 展开 收起
A

Valid CID rate低可以排查的方向有3个:

1. 测序情况。测序质量低会影响比对结果。除了Q30还需要检查call N的情况,可以查看下机报告的base distribution,如果出现N碱基的比例高的情况,就需要考虑是因为测序问题,影响了valid CID rate,最好优先排查。

2. 芯片mask h5文件和fastq不对应。因为mask里记录的CID和对样本测序得到的CID不匹配,导致valid CID rate低。这个情况如果单一出现,一般比例极低,但如果涉及到后一个情况,比例波动比较大,需要酌情判断。

3. 污染/混样。在实验过程中或者建库测序的时候混入了其他样本,因为受到污染,所以影响了valid CID rate。那么可能存在两张芯片,同时可以和这个文库的下机数据比对上。如果混的比较多,可以有明确的组织pattern,如果比例极小,有的情况下会有部分高亮点。

12
2
联系我们
即刻了解华大时空组学
咨询