scRNA-seq_v3 User Manual

DCS CloudAbout 8 min

scRNA-seq_v3 User Manual

1. Scope of application

scRNA-seq_v3 can handle the high-throughput sequencing data analysis for the following kits:

DNBelab C Series High-throughput Single-cell RNA Library Preparation Set V3.0.

2. Product Introduction

The scRNA-seq is an automated analysis process developed based on the DCS Cloud, which includes data filtering and quality control, reference genome alignment and annotation, effective cell selection, downstream analysis, and report output.

2.1 Analysis Workflow Diagram

Figure 2  Analysis System Workflow Diagram

2.1.1 Data Filtering and Quality Control

Perform fastq data quality control according to the quality standards filled in the configuration file, removing low average base quality reads, trimming reads to specified lengths, and retaining high-quality sequences for subsequent analysis.

2.1.2 Reference genome alignment and annotation

Use STAR software to align the filtered cDNA fastq files with the reference genome, perform UMI correction, and provide annotation results.

2.1.3 Effective cell selection

Use the EmptyDrops method to select effective cells from the raw matrix, and merge cells using cosine similarity to generate a standard matrix file for downstream analysis.

2.1.4 Downstream analysis

Perform cell quality control and doublet filtering based on the generated matrix, conduct dimensionality reduction and clustering, and annotate cell types.

2.1.5 Report output

Compile and summarize the analysis results into an HTML report.

3. User Manual

scRNA-seq standard analysis workflow managed through the DCS Cloud for sample input and report output. The following provides a detailed guide on how to use scRNA-seq standard analysis workflow based on the DCS Cloud.

3.1 Guide Overview

This chapter introduces how to use scRNA-seq standard analysis workflow for analysis. Before using, please read and understand the content carefully to ensure correct usage of scRNA-seq.

3.2 Usage Scenario 1: Manual Submission

The operation consists of four steps: upload data, construct reference genome (optional), sample information entry, and start analysis. After completing the sample information entry, run the task, when the client sees the task status as completed, it indicates that the task has been completed, and the report section can be viewed (see section 2.4 for details).

3.2.1 Step One: Upload data

1) Click on the navigation bar [Data] to enter the Data Management page, navigate to the target folder, and click the upper right corner [+Add files]-[Tool upload] to upload data.

Figure 3 -1 File Upload Step One
  1. Click [Upload] browse and select the required file (Figure 3-2), after uploading, the file will be displayed in the target folder (if this is the first upload, you need to click [Install and start the transport client] to install the required tools) .
Figure 3-2 File Upload Step Two

3.2.2 Step Two: Construct Reference Genome (Optional)

  1. Click the navigation bar [Workflow ] to enter the Process Analysis page, enter scRNA-seq-build-index in the search box, and click [Run] .
Figure 3-3 Construct Reference Genome Step One
  1. Select Run workflow, enter Entity ID, and click [Next ].
Figure 3 -4  Step Two of Building the Reference Genome
  1. Enter the reference genome information, and after completion click [Next].
Figure 3-5 Step Three of Building the Reference Genome

::: warnig

Explanation of Variables for Entering Reference Genome Information :

  • refName:The species name of the reference genome, which will be displayed in the analysis report;

  • GTF:Genome annotation GTF file;

  • chrM:Mitochondrial name;

  • FASTA:Genome FASTA file;

  • Outdir:Output file path;

  • Cpu:CPU required for running;

  • Mem:Memory size required for running.

:::

  1. Click [Run] to start the analysis.
Figure 3 -6  Step Four of Building the Reference Genome
  1. After the task is completed, the Status will display as completed. Copy the Task ID (Figure 3 -7 ), click on the navigation bar [Data], and enter the Task ID to search (Figure 3 -8 ). The star_index file will serve as the reference genome file for the standard analysis process of single-cell RNA (Figure 3 -9 ).
Figure 3 -7  Step Five of Constructing the Reference Genome
Figure 3 -8  Step Six of Constructing the Reference Genome
Figure 3 -9  Step Seven of Constructing the Reference Genome

3.2.3 Step Three: Sample Information Entry

  1. Click on the navigation bar [Workflow] to enter the Process Analysis page. In the search box, enter sc RNA-seq _ v3, and click [Run].
Figure 3-10  Sample Information Entry Step One
  1. Select Run workflow, enter Entity ID, click [Next].
Figure 3 -11  Sample Information Entry Step Two
  1. Enter sample information, and after completion click [Next].
Figure 3 -12  Sample Information Entry Step Three

Note

Explanation of Sample Information Entry Variables :

  • sampleID: Sample name, defaults to be consistent with Entity ID;

  • cDNA: cDNA library fastq format R1, R 2 sequences, note that for each pair of fastq, select R 1 first, then select R 2;

  • Oligo: oligo library fastq format R1, R 2 sequences, note that for each pair of fastq, select R 1 first, then select R 2;

  • genomeDir: Reference genome file, such as the star_index file in the Task ID folder if constructed independently in step two ( 3.2.2 Construct Reference Genome );

  • Outdir:Output file path;

  • expectcells: Expected cell count, can be selected based on experience;

  • forcecells: Force selection of bead count, forcibly cut off bead count based on drop chart; If it is 0, retain all cells;

  • Cpu: Required CPU size for operation, the minimum required CPU value is 8, recommended value is 16;

  • Mem: Required memory size for operation.

3.2.4 Step Four: Start Analysis

Click [Run] to start the analysis.

Figure 3 -13  Start Analysis

3.3 Usage Scenario 2: Table Submission

The operation includes five steps: upload data, construct reference genome (optional), download sample template, fill in and import sample template, start analysis. After completing the sample template import, tasks can be run in batches, when the customer sees the task status as completed, it indicates that the task is complete, and the report section can be viewed (see section 3.4 for details).

3.3.1 Step One: Upload data

Step one is consistent with usage scenario one (manual submission) (see 3.2.1 Step One: Upload Data for details).

3.3.2 Step Two: Construct Reference Genome (Optional)

Step two is consistent with usage scenario one (manual submission) (see 3.2.2 Step Two: Construct Reference Genome for details).

3.3.3 Step Three: Sample Information Entry Table Download

  1. Click Navigation Bar [Data], select [Table] -[Download] (as shown in Figure 3 -14 ), click [Data model template], select scRNA-seq _ v3.2.0 template for download.
Figure 3-14  scRNA-seq Sample Template Download Navigation
  1. After opening scRNA-seq_v3.2.0 sample template Excel as shown in Figure 3-15.
Figure 3-15  scRNA-seq Sample Template Table

3.3.4 Step Four: Sample Information Import

  1. Under this usage scenario, the sample import table must be filled out Work Table (Figure 3-15 ). This scenario indicates that after importing the sequenced sample data into the table, it directly proceeds to analysis.

Note

Excel Notes:

[ 1 ] The file path for import must already exist on the cloud platform.

[ 2 ] In the template, all content is mandatory, and no field may be left empty.

[ 3 ] The SampleID in Excel must be unique; if the SampleID is the same, it is assumed to be the same task.

[ 4 ] Cells in Excel cannot be merged, and there should be no spaces or special characters before or after the cell content.

[5 ] Sample Entry for Analysis (Figure 3-16):

  • sampleID: Sample name, defaults to be consistent with Entity ID ;

  • cDNA: cDNA library fastq format R1, R 2 sequences, note that for each pair of fastq, select R 1 first, then select R 2;

  • Oligo: oligo library fastq format R1, R 2 sequences, note that for each pair of fastq, select R 1 first, then select R 2;

  • genomeDir: Reference genome file; if constructed independently in step two (3.3.2 Build Reference Genome), select the star_ index file within the Task ID folder.

  • Outdir: Output file path;

  • expectcells: Expected cell count, can be selected based on experience;

  • forcecells: Force selection of bead count, forcibly cut off bead count based on drop chart; If it is 0, retain all cells;

  • Cpu: Required CPU size for operation, the minimum required CPU value is 8, recommended value is 16 ;

  • Mem: Required memory size for operation.

Figure 3-16  Fill in the Sample Template (Sample Information Entry)
  1. After configuring the sample template analysis sample entry work table, return to [Data] interface, click [Table] - [+Add table] (Figure 3 -17).
Figure 3-17   Step One of Sample Information Import
  1. Click [Click to upload/Drop here] browse and select the completed sample information table, then click [confirm] (Figure 3-18),after the upload is complete, the file will be displayed in the target folder.

  2. Click on the navigation bar [Workflow] to enter the Process Analysis page, enter scRNA-seq_v3 in the search box, and click [Run] (Figure 3 -19).

Figure 3-19  Sample Information Import Step Three
  1. Select Run workflow(s), click on Please select table, choose the table imported in subsection 3), select the required rows, and click [Next] (Figure 3 -20 ).
Figure 3-20 Sample Information Import Step Four
  1. Click on Values and select the corresponding values, such as cDNA selection of ${cDNA1} and ${cDNA2}, noting to select in order (as shown in Figure 3-21); Select Oligo ${Oligo1} and ${Oligo2}, noting to select in order (as shown in Figure 3-22).
Figure 3-22 Sample Information Import Step Six
  1. Enter sample information, and after completion click [Next], ensuring that the parameter settings are correct (as shown in Figure 3-23).
Figure 3-23 Sample Information Import Template

3.3.5 Step Five: Start Analysis

Click [Run] to start the analysis (Figure 3 -24 ).

Figure 3 -24 Start Analysis

3.4 View Report and Download Result Files

  1. Click on the navigation bar [Task], when the task status shows as completed, it indicates that the task is complete, and you can view the report section (as shown in Figure 3-25 ).
Figure 3-25 Report Viewing Step One
  1. Click on the navigation bar [Data], enter the Data Management page, search according to the task's Task ID, and click to enter the Task ID folder (as shown in Figure 3 -26 ).
Figure 3-26 Report Viewing Step Two
  1. Click to enter the Entity ID folder (as shown in Figure 3 -27 ).
Figure 3-27 Report Viewing Step Three
  1. Click to enter 04. report folder (as shown in Figure 3 -28 ).
Figure 3-28 Report Viewing Step Four
  1. Select Entity ID_report.html folder, click [Download] -[Raysync download] (as shown in Figure 3 -29 ).
Figure 3-29 Report Viewing Step Five
  1. Click [Transfer]-[Download]-[Confirm], select the target directory and download the report (as shown in Figure 3 -30 ).
1726305080632.png
Figure 3-30 Report Viewing Step Six

4. FAQ

  1. What are the official single-cell processes and what are the corresponding versions of the kits?

scRNA-seq_v3 and scRNA-seq-3.1.5 are the officially maintained processes.

scRNA-seq-3.1.5, corresponding to the kit DNBelab C Series High-throughput Single-cell RNA Library Preparation Set V2.0.

scRNA-seq_v3 corresponds to dnbc4tools v2.1.2 of MGI, and corresponds to the kit: DNBelab C Series High-throughput Single-cell RNA Library Preparation Set V3.0.

  1. What are the requirements for the gtf file format after the Reference is constructed?

The chromosome name in the gtf file should be the same as the chromosome name in the genome file.

Last update: