EN
SCOPE-chip微流控芯片分析软件SCelLiVe®组织保存液和解离液FocuSCOPE®靶向高通量单细胞测序

首页 > 产品与技术 > 核心技术 > 分析软件 > 软件教程

FocuSCOPE®单细胞EB病毒基因检测数据分析

一、简介

人类EBV(Epstein-Barr virus,EBV)是疱疹病毒科嗜淋巴细胞病毒属的成员,人群普遍易感,超过90%的正常人感染过EBV,多为无症状携带。传统EBV检测常用抗体检测,RNAScope,PCR技术等,然而单细胞层次上的靶向测序目前还相对空白。为了进行单细胞水平的靶向测序,提高EBV的检出率,新格元2021年推出了FocuSCOPE® Single Cell mRNA × EBV Library Kit,该试剂盒主要针对EBNA1、EBNA2、EBER1、EBER2、ZEBRA等设计捕获靶点。我们知道EBER1/EBER2(EBERs)被认为是EBV潜伏感染的标志物。FocuSCOPE®单细胞EB病毒基因检测试剂盒可以在提高EB病毒检测分辨率的基础上给EB病毒基础研究提供单细胞水平的研究工具。

 

二、实验原理

FocuSCOPE®单细胞EB病毒基因检测试剂盒能完成单细胞捕获、细胞裂解、分子标签标记、细胞mRNA捕获、全转录组文库和EB病毒靶向基因转录组富集文库的构建等全流程实验。

 

三、应用场景

EB病毒与细胞亚群

  • 肿瘤各细胞类群EB病毒基因检测
  • EB病毒对各细胞类群基因表达的调控

EB病毒与耐药机制

  • 不同疾病EB病毒基因表达比较
  • 感染动力学研究
  • EB病毒成瘤机制探究
  • 不同疾病EB病毒生命周期调控
  • 疾病相关检测标志物发掘

未来方向:探索临床治疗

  • 用药前vs用药后
  • 不同治疗策略对比
  • 预后监测

 

四、产品优势

高效捕获靶向区域

  • 特异性探针设计,可提高靶向捕获基因效率

覆盖EB病毒的全部生命周期

  • 靶向基因覆盖了EB病毒的裂解期和潜伏期
  • 三种潜伏状态的标志基因

PolyA(-)RNA捕获

  • EBERs RNA捕获,突破传统单细胞RNA测序
  • 依赖于mRNA结构捕获的限制,实现单细胞层面研究EBERs基因的表达与调控

靶向基因真实表达

  • 体现EB感染细胞中所有基因的真实表达,
  • 无偏检测细胞内靶基因的表达值。

单细胞层面EB病毒与宿主的相互作用

  • 能够在单个细胞层面研究EB病毒感染动力学探究
  • EBV致瘤机制

 

五、CeleScope FocuSCOPE® EB病毒基因检测分析流程

CeleScope生成的单细胞转录动态监测数据的基本流程。 dynaseq pipeline (单细胞转录动态监测数据分析) 包含10个主要指令,可以通过 celescope capture_virus {指令} --help 查看:

$ celescope capture_virus --help
usage: celescope capture_virus [-h]
                               {mkref,sample,barcode,cutadapt,consensus,star_virus,count_virus,filter_virus,analysis_virus}
                               ...

Single-cell capture_virus

positional arguments:
  {mkref,sample,barcode,cutadapt,consensus,star_virus,count_virus,filter_virus,analysis_virus}

optional arguments:
  -h, --help            show this help message and exit

  • 下载测试数据与脚本
    为了便于测试软件,我们在github上托管了测试数据(请注意,这些数据仅供测试用途,部分数据是人为生成的)。

mkdir test_dir
cd test_dir
git clone https://github.com/singleron-RD/celescope_test_data.git
git clone https://github.com/singleron-RD/celescope_test_script.git

当然,也可以在gitee上下载:

mkdir test_dir
cd test_dir
git clone https://gitee.com/singleron-rd/celescope_test_data.git
git clone https://gitee.com/singleron-rd/celescope_test_script.git

所有的软件DEMO测试数据我们已经在 celescope rna 的教程中下载过,这里可以看一下capture_virus数据的结构,让我们看一看下载的测试数据

$ tree -L 2
.
|-- EBV_genome
|   |-- EBV_genome.fasta
|   `-- mkref.sh
|-- capture_virus_script
|   |-- EBV.mapfile
|   `-- EBV_run.sh
|-- fake_match_dir
|   |-- 06.count
|   `-- 08.analysis_rna_virus
`-- fastq
    |-- capture_virus_1.fq.gz
    `-- capture_virus_2.fq.gz

下面是测试脚本:

$ tree
.
|-- EBV.mapfile
`-- EBV_run.sh

 

六、CeleScope FocuSCOPE® EB病毒基因检测分析流程实操

单细胞EB病毒基因检测研究在实验过程中会构建一个单细胞转录组文库和单细胞EB病毒靶基因序列富集,因此数据分析也分为两个环节:
(1) 单细胞转录组分析
(2) 单细胞EB病毒靶基因检测分析
本篇文章内只介绍单细胞EB病毒靶基因检测分析流程,而celescope分析单细胞转录组数据的教程已在前期中介绍过。在分析之前我们先要激活我们celescope软件的运行环境,使用conda activate celescope命令进行激活。

 

1. 用 mkref 指令创建一个参考基因组文件

  • mkref 用于创建基因组参考目录,每个物种构建一次参考基因组即可,以后运行直接读取,不用多次构建。 需要基因组序列文件与注释信息:fasta文件和gtf文件

第一步,下载EB病毒参考基因组序列文件 首先我们下载我们在github上托管了测试数据,我们就可以获得EB病毒参考基因组序列文件。

mkdir test_dir
cd test_dir
git clone https://github.com/singleron-RD/celescope_test_data.git

下载完成以后,通过脚本命令cd /celescope_test_data/capture_virus/EBV_genome进入到EBV_genome文件目录中,我们可以查看一下具体内容。

$ tree
.
|-- EBV_genome.fasta
`-- mkref.sh

第二步, 使用mkref指令构建EB病毒参考基因组索引文件。

  • 配置mkref.sh脚本

$ vim mkref.sh 
celescope capture_virus mkref \
 --genome_name EBV \
 --fasta EBV_genome.fasta \
 --genomeSAindexNbases 7
# --dry_run #该指令不运行,该指令指只写入config file,然后退出。  

  • 运行配置脚本—sh mkref.sh
    运行完以后我们可以查看一下索引文件的生成。

$ tree
.
|-- EBV_genome.fasta
|-- Genome
|-- Log.out
|-- SA
|-- SAindex
|-- celescope_genome.config
|-- chrLength.txt
|-- chrName.txt
|-- chrNameLength.txt
|-- chrStart.txt
|-- genomeParameters.txt
`-- mkref.sh

 

2、用 multi_capture_virus构建celescope capture_virus 分析的 shell 脚本

一个是配置 mapfile文件--mapfile 是multi_capture_virus下的参数,需要提供一个制表符分隔 (tab-delimited) 的文本文件。mapfile 的每一行代表双端 (paired-end) fastq文件。

$ cat EBV.mapfile 
capture_virus   /../celescope_test/celescope_test_data/capture_virus/fastq      capture_virus_test    /../celescope_test/celescope_test_data/capture_virus/fake_match_dir

第一列: capture_virus_fastq_ID:对应 capture_virus_fastq文件的名称前缀 第二列: capture_virus_datapath:对应 capture_virus_fastq文件的路径 第三列: capture_virus_name:对应质控报告的名称 第四列:对应与其“配对的”单细胞转录组分析 “fake_match_dir” 路径

另一个是 shell 脚本文件:EBV_run.sh

$ vim EBV_run.sh 
multi_capture_virus\
 --mapfile ./EBV.mapfile \
 --virus_genomeDir /mnt/sdd/singleron_training_class/resources/celescope_test/celescope_test_data/capture_virus/EBV_genome \
 --not_consensus \
 --mod shell

 

3、生成shell脚本

(1)运行刚编辑好的shell脚本`EBV_run.sh

$ sh EBV_run.sh

(2)运行完以后就可以自动生成一个名称为shell的文件目录。

$ tree -L 1
.
|-- EBV.mapfile
|-- EBV_run.sh
`-- shell

shell文件夹中会有一个以capture_virus_test命名的脚本运行存储数据的目录,以及一个运行的shell脚本capture_virus_test.shcapture_virus_test.sh脚本中的每行指令对应每一步分析(质控报告的每一部分数据)。

 

4、投递shell脚本

进入到shell目录中,就可以运行脚本capture_virus_test.sh,然后在终端命令行中输入sh capture_virus_test.sh。那么程序就会在当前的终端界面运行。但是,如果在当前的终端界面中进行运行,终端界面就不能关闭,也不能掉线,否则运行的程序就会中断。那么,为了避免这种情况发生,我们可以使用nohup将运行脚本投递后台运行,执行nohup sh capture_virus_test.sh &,并生成一个nohup.out运行的日志文件。

$ tree -L 1
.
|-- capture_virus_test
|-- capture_virus_test.sh
`-- nohup.out

如果对每一步做了什么感兴趣,可以单独运行查看,capture_virus_test.sh里面是:

$ cat capture_virus_test1.sh 
celescope capture_virus sample --outdir .//capture_virus_test1/00.sample --sample capture_virus_test1 --assay capture_virus --thread 4 --chemistry auto  --fq1 /mnt/sdd/singleron_training_class/resources/celescope_test/celescope_test_data/capture_virus/fastq/capture_virus_1.fq.gz 
celescope capture_virus barcode --outdir .//capture_virus_test1/01.barcode --sample capture_virus_test1 --assay capture_virus --thread 4 --chemistry auto --lowNum 2  --fq1 /mnt/sdd/singleron_training_class/resources/celescope_test/celescope_test_data/capture_virus/fastq/capture_virus_1.fq.gz --fq2 /mnt/sdd/singleron_training_class/resources/celescope_test/celescope_test_data/capture_virus/fastq/capture_virus_2.fq.gz 
celescope capture_virus cutadapt --outdir .//capture_virus_test1/02.cutadapt --sample capture_virus_test1 --assay capture_virus --thread 4 --minimum_length 20 --nextseq_trim 20 --overlap 10 --insert 150  --fq .//capture_virus_test1/01.barcode/capture_virus_test1_2.fq 
celescope capture_virus consensus --outdir .//capture_virus_test1/03.consensus --sample capture_virus_test1 --assay capture_virus --thread 4 --threshold 0.5 --not_consensus --min_consensus_read 1  --fq .//capture_virus_test1/02.cutadapt/capture_virus_test1_clean_2.fq 
celescope capture_virus star_virus --outdir .//capture_virus_test1/04.star_virus --sample capture_virus_test1 --assay capture_virus --thread 4 --outFilterMultimapNmax 1 --starMem 30 --virus_genomeDir /mnt/sdd/singleron_training_class/resources/celescope_test/celescope_test_data/capture_virus/EBV_genome  --fq .//capture_virus_test1/02.cutadapt/capture_virus_test1_clean_2.fq 
celescope capture_virus count_virus --outdir .//capture_virus_test1/05.count_virus --sample capture_virus_test1 --assay capture_virus --thread 4 --min_query_length 35  --capture_bam .//capture_virus_test1/04.star_virus/capture_virus_test1_virus_Aligned.sortedByCoord.out.bam --match_dir /mnt/sdd/singleron_training_class/resources/celescope_test/celescope_test_data/capture_virus/fake_match_dir 
celescope capture_virus filter_virus --outdir .//capture_virus_test1/06.filter_virus --sample capture_virus_test1 --assay capture_virus --thread 4 --min_support_reads 2 --umi_threshold_method auto  --match_dir /mnt/sdd/singleron_training_class/resources/celescope_test/celescope_test_data/capture_virus/fake_match_dir --raw_read_count_file .//capture_virus_test1/05.count_virus/capture_virus_test1_raw_read_count.json 
celescope capture_virus analysis_virus --outdir .//capture_virus_test1/07.analysis_virus --sample capture_virus_test1 --assay capture_virus --thread 4  --filter_tsne_file .//capture_virus_test1/06.filter_virus/capture_virus_test1_filtered_UMI_tsne.csv

 

5、结果目录

$ tree
.
|-- 00.sample
|   `-- stat.txt
|-- 01.barcode
|   |-- capture_virus_test1_2.fq
|   `-- stat.txt
|-- 02.cutadapt
|   |-- capture_virus_test1_clean_2.fq
|   |-- cutadapt.log
|   `-- stat.txt
|-- 04.star_virus
|   |-- capture_virus_test1_virus_Aligned.out.bam
|   |-- capture_virus_test1_virus_Aligned.sortedByCoord.out.bam
|   |-- capture_virus_test1_virus_Aligned.sortedByCoord.out.bam.bai
|   |-- capture_virus_test1_virus_Log.final.out
|   |-- capture_virus_test1_virus_Log.out
|   |-- capture_virus_test1_virus_Log.progress.out
|   |-- capture_virus_test1_virus_SJ.out.tab
|   `-- stat.txt
|-- 05.count_virus
|   |-- capture_virus_test1_raw_read_count.json
|   `-- stat.txt
|-- 06.filter_virus
|   |-- capture_virus_test1_filtered_UMI_tsne.csv
|   `-- stat.txt
|-- 07.analysis_virus
|   `-- stat.txt
`-- capture_virus_test1_report.html

当我们运行完以后,就可以得到一个单细胞EB病毒基因检测分析的网页报告。

  • 质控报告的样本和软件的基本信息
  • 数据质控信息
  • 基因组比对信息
  • 细胞与基因定量情况
  • EB病毒基因靶基因信息

以上就是一个完整的新格元单细胞EB病毒基因检测分析过程,接下来就可以进行FocuSCOPE®单细胞EB病毒基因检测数据的分析了。

本文仅做软件安装测试使用,更多软件更新信息参见:https://github.com/singleron-RD/CeleScope

联系我们
  • 微信公众号
  • 售后公众号