STOmics logo STOmics logo

EN
常见问答 常见问答 常见问答
常见问答
筛选项目 清除选项
时空产品
时空转录组FF
时空转录组FF兼容mIF
时空转录组FFPE
时空转录组大尺寸芯片
时空蛋白转录组Stereo-CITE
分析工具
技术流程
实验准备
透化实验
转录组实验
文库构建
测序
数据分析
132条搜索结果:
Q 细胞分割的效果会受到什么因素的影响比较大?如何获得最佳分割效果? 展开 收起
A
  • 细胞分割的效果受到显微镜拍照的情况和分割算法等多重因素的影响。拍照时如果存在组织过曝、模糊等因素,会影响算法识别细胞,导致无法分割。对于密集区域本身清晰度不够,并且可能存在细胞重叠的情况,那么也会导致算法难以识别。如果图像中组织不同区域局部亮度不均匀、或者存在实验导致的拖尾、背景存在杂质等情况,也会导致分割错误。(部分示例见下方)详细信息请查阅《Stereo-seq 空间多组学技术成像指南》。


  • 从算法本身来讲,因为分析流程的自动分割算法是基于人工标注的数据集,学习训练而来,所以一些非常少见的细胞形态未能涵盖进数据集中,也可能会导致算法无法准确识别出细胞。


  • 如果自动算法分割效果不佳,可以尝试使用 StereoMap 桌面端图像处理软件进行手动调整,也可以尝试用其他算法重新分割,将分割后的 .tif格式的二进制细胞掩膜文件重新导入 StereoMap 做后续分析。详细操作请查阅《StereoMap 用户手册》>图像处理指南>核染色图像>#第四步:细胞分割。


注:每个染色类型推荐的分割算法可参考:CellBinDB:大规模多模态数据集助力细胞分割模型开发与评估

https://stomics.tech/col64/1470

23

Q SAW每一步分析包含软件的参数有详细说明吗? 展开 收起
A

请登录时空组学官网:https://www.stomics.tech/products/BioinfoTools/OfflineSoftware/SAWOperationManual下载查阅SAW详细说明书,GitHub链接:https://github.com/STOmics/SAW


Reference & GTF/GFF注释文件

Q:在时空组学分析中,对基因注释文件GTF/GFF格式的要求是什么?

  1. 文件格式:

    1. GFF文件 或者 GTF文件,文件后缀名支持 gtf/gtf.gz,gff/gff.gz,gff3/gff3.gz

  2. GTF文件格式:

  1. 注释行以 # 开始

  2. 主体部分共 9列,以tab作为分隔符:seqname source feature start end score strand frame attributes

    • type:注释信息的类型必须含有gene,transcript 和 exon

    • start/end:最大值需小于2^{31}

    • strand:链的正向与负向,分别用加号+和减号-表示。

    • 第9列为attributes,格式为tag "value"(标签“值”),不同属性之间以空格相隔 ; 必须要有以下4个

    • gene_name value

    • gene_id value: 表示转录本在基因组上的基因座的唯一的ID。gene_id与value值用空格分开,如果值为空,则表示没有对应的基因。

    • transcript_name value

    • transcript_id value: 预测的转录本的唯一ID。transcript_id与value值用空格分开,空表示没有转录本。

    c. 目前最大有效基因数必须小于2^{20},即1048576

    d. 不可以乱序,即同一个gene的transcript/exons需按顺序排列

    3. GFF文件格式:

    a. 注释行以 # 开始

    b. 主体部分共 9列,以tab作为分隔符:seqid source type start end score strand phase attributes

    • type:注释信息的类型必须含有gene, mRNA和 exon

    • start/end:最大值需小于2^{31}

    • strand:“+”表示正链,“-”表示负链,“.”表示不需要指定正负链,“?” 表示未知

    • 第9列为attributes,格式为tag=value (标签=值),不同属性之间以分号相隔

      - 需要存在ID Name Parent(对gene无需判断Parent)

      - 对于第三列的命名规则请务必仔细研究 ⇒ “树状分级” (不能只列出child行 而没有parent行!)示例如下:

c. 目前最大有效基因数必须小于2^{20},即1048576

d. 可以乱序,但仍需满足 gene必须出现在对应mRNA之前,mRNA必须出现在对应的exon之前的规则

4. 其他注意事项:

  1. gene/gene_name(基因的名字) 值不含有特殊符号(空格,各类型括号,引号,<>,%等)。支持使用的常见特殊符号有”_“,"."。

  2. gene/gene_name(基因的名字) 值长度小于64个字符

  3. 虽然GFF文件现在大部分使用的都是第三版(GFF3),但是文件命名时请命名为.gff ;同理对于GTF文件也请在文件命名时采用.gtf

Q 基因表达可视化结果异常,没有组织轮廓怎么办? 展开 收起
A

第一步:检查HTML报告中Valid CID Reads的比例是否正常,如低于30%请确认测序FASTQ文件和芯片SN对应;

第二步:检查Clean Reads下的比例

(1)参考基因组格式异常:Multi-Mapped Reads比例高, Uniquely Mapped Reads比例很低且几乎全部注释失败,需要检查注释使用的GTF/GFF文件是否符合格式要求,是否可以通过检测程序;

(2)存在混样的可能性:需要自行排查实验部分;

Q 关于饱和曲线(Saturation)的三张曲线图都有什么意义? 展开 收起
A

  • HTML报告中的饱和度分析可评价测序数据的整体质量,为提高计算效率,在指定bin size维度下从成功注释reads中进行小样本随机抽样,故同一数据多次运行的结果可能略有区别,但曲线整体形态一致。

  • 图1:随机抽样数量增加,bin200维度下的基因中位数逐渐增加。

  • 图2:根据随机抽样样本的Unique Reads数据拟合而出的曲线。

  • 图3:对抽样样本中的Unique Reads(CID、gene和MID都唯一的reads)进行统计,饱和度值=1-(Unique Reads)/(Total Annotated Reads),随着抽样量增加,拟合曲线近平缓代表数据趋于饱和,是否加测需根据项目整体设计和样品情况而定,例如珍贵样品建议可加测。

注:三张图片的x轴相同,y轴分为基因中位数、Unique Reads和饱和度值


33333



Q stereoPipeline.sh 脚本中哪个参数能将Bin200调整成Bin20? 展开 收起
A

可通过spatialCluster模块中的-s参数设置不同的binsize选择,但需注意SAW直接输出的聚类结果默认只支持Bin200的结果展示,仅作为一个大致的参考。如果要进行更精确的聚类,推荐您使用Stereopy进行下游分析,这部分分析是在SAW之外的。

Q StereoMap 只是单纯的可视化软件吗? 展开 收起
A

StereoMap 是一款无需编程的桌面端软件,支持 Stereo-seq 数据交互式的可视化及图像数据的手动分析。上游分析中,Image QC 工具评估图像是否可以调用 SAW 自动的图像分析算法,使用 Image Processing 手动配准或圈选组织/细胞。

注:ImageStudio 已合入 StereoMap (≥4.0)

Q 如何解析GEF格式文件? 展开 收起
A

此功能的使用需根据SAW版本进行区分。

  • SAW >= 8.0:

    • 格式转换工具请使用SAW convert。详情请查阅《SAW 用户手册》>使用教程>数据格式转换。

    • 格式详情请查阅《SAW 用户手册》>高级设置>Expression matrix format。


  • SAW < 8.0:

Option1:使用C++编译的 geftools:

1. https://github.com/BGIResearch/geftools


Option2:使用python包 gefpy:

1. https://pypi.org/project/gefpy/

2. https://gefpy.readthedocs.io/en/latest/index.html

3. pip install gefpy==0.6.1


Option3:如已安装SAW sif(如v5.1.3):

1. https://hub.docker.com/repository/docker/stomics/saw

2. singularity exec SAW_v5.1.3.sif cellCut

3. 请使用singularity 3.8及以上版本

Bash
 
export HDF5_USE_FILE_LOCKING=FALSE
  ## gef2gem using geftools
  geftools view -i
<SN>.gef -o <SN>.gem -s <SN>
  # -i input square bin GEF, e.g.SN.raw.gef or SN.gef
  # -o output GEM
  # -s SN
 
  ## gef2gem using gefpy
  python
  >>> from gefpy.bgef_reader_cy import BgefR
  >>> bgef=BgefR(filepath='
<SN>.gef',bin_size=200,n_thread=4)
  >>> bgef.to_gem('
<SN>.bin200.gem')
 
  ## gef2gem using SAW sif
  ## export SINGULARITY_BIND="/path/to/input/dir,/path/to/output/dir"
  singularity exec SAW_v5.1.3.sif cellCut view -i
<SN>.gef -o <SN>.gem -s <SN>
 
  ## cgef2cgem
  geftools view -i
<SN>.cellbin.gef   -o <SN>.cellbin.gem   -d <SN>.raw.gef   -s <SN>
  # -i input cellbin GEF
  # -o output cellbin GEM
  # -d input square bin GEF, e.g. SN.raw.gef or SN.gef
  # -s SN
 
  ## gem2gef
  geftools bgef -i
<SN>.gem -o <SN>.gef -b 1,20,50 -O Transcriptomics
  # -i input square bin GEM
  # -o output square bin GEF
  # -b bin sizes seqarate by comma, default: 1,10,20,50,100,200,500
  # -O omics name


Q MID是什么?MID是表示每个分析单元检测到的转录本数目吗? 展开 收起
A

MID(Molecular ID)即分子编码,实验过程中每个mRNA分子带有唯一的MID,用于区分来源于不同mRNA分子的PCR扩增子。MID(即UMI)代表每个基因在每个分析单元中检测到的转录本数目。

Q 时空转录组+多重免疫荧光的实验中,准备试剂时,血清、一抗和二抗都需要14000g 离心10 min,离心是原液离心还是稀释后的离心,离心的目的是什么? 展开 收起
A

主要目的是去除杂质,因为试剂中含有杂质,所以要离心。按照试剂盒使用说明书操作即可。

Q 时空转录组+多重免疫荧光的实验中,不用FcR对染色和后续的捕获会有影响吗?比如只有针对小鼠和人的FcR,没有猴的。 展开 收起
A

FcR主要封闭非特异性抗原结合的位点,如果不封闭,会与目标抗原非特异性结合而影响目标位点的判断。请登录BioLegend 官网查询是否有针对猴的,或者咨询一下抗体公司。

联系我们
即刻了解华大时空组学
咨询