人类EBV(Epstein-Barr virus,EBV)是疱疹病毒科嗜淋巴细胞病毒属的成员,人群普遍易感,超过90%的正常人感染过EBV,多为无症状携带。传统EBV检测常用抗体检测,RNAScope,PCR技术等,然而单细胞层次上的靶向测序目前还相对空白。为了进行单细胞水平的靶向测序,提高EBV的检出率,新格元2021年推出了FocuSCOPE® Single Cell mRNA × EBV Library Kit,该试剂盒主要针对EBNA1、EBNA2、EBER1、EBER2、ZEBRA等设计捕获靶点。我们知道EBER1/EBER2(EBERs)被认为是EBV潜伏感染的标志物。FocuSCOPE®单细胞EB病毒基因检测试剂盒可以在提高EB病毒检测分辨率的基础上给EB病毒基础研究提供单细胞水平的研究工具。
FocuSCOPE®单细胞EB病毒基因检测试剂盒能完成单细胞捕获、细胞裂解、分子标签标记、细胞mRNA捕获、全转录组文库和EB病毒靶向基因转录组富集文库的构建等全流程实验。
EB病毒与细胞亚群
EB病毒与耐药机制
未来方向:探索临床治疗
高效捕获靶向区域
覆盖EB病毒的全部生命周期
PolyA(-)RNA捕获
靶向基因真实表达
单细胞层面EB病毒与宿主的相互作用
CeleScope生成的单细胞转录动态监测数据的基本流程。 dynaseq pipeline (单细胞转录动态监测数据分析) 包含10个主要指令,可以通过 celescope capture_virus {指令} --help 查看:
$ celescope capture_virus --help
usage: celescope capture_virus [-h]
{mkref,sample,barcode,cutadapt,consensus,star_virus,count_virus,filter_virus,analysis_virus}
...
Single-cell capture_virus
positional arguments:
{mkref,sample,barcode,cutadapt,consensus,star_virus,count_virus,filter_virus,analysis_virus}
optional arguments:
-h, --help show this help message and exit
mkdir test_dir
cd test_dir
git clone https://github.com/singleron-RD/celescope_test_data.git
git clone https://github.com/singleron-RD/celescope_test_script.git
当然,也可以在gitee上下载:
mkdir test_dir
cd test_dir
git clone https://gitee.com/singleron-rd/celescope_test_data.git
git clone https://gitee.com/singleron-rd/celescope_test_script.git
所有的软件DEMO测试数据我们已经在 celescope rna 的教程中下载过,这里可以看一下capture_virus数据的结构,让我们看一看下载的测试数据
$ tree -L 2
.
|-- EBV_genome
| |-- EBV_genome.fasta
| `-- mkref.sh
|-- capture_virus_script
| |-- EBV.mapfile
| `-- EBV_run.sh
|-- fake_match_dir
| |-- 06.count
| `-- 08.analysis_rna_virus
`-- fastq
|-- capture_virus_1.fq.gz
`-- capture_virus_2.fq.gz
下面是测试脚本:
$ tree
.
|-- EBV.mapfile
`-- EBV_run.sh
单细胞EB病毒基因检测研究在实验过程中会构建一个单细胞转录组文库和单细胞EB病毒靶基因序列富集,因此数据分析也分为两个环节:
(1) 单细胞转录组分析
(2) 单细胞EB病毒靶基因检测分析
本篇文章内只介绍单细胞EB病毒靶基因检测分析流程,而celescope分析单细胞转录组数据的教程已在前期中介绍过。在分析之前我们先要激活我们celescope软件的运行环境,使用conda activate celescope命令进行激活。
第一步,下载EB病毒参考基因组序列文件 首先我们下载我们在github上托管了测试数据,我们就可以获得EB病毒参考基因组序列文件。
mkdir test_dir
cd test_dir
git clone https://github.com/singleron-RD/celescope_test_data.git
下载完成以后,通过脚本命令cd /celescope_test_data/capture_virus/EBV_genome进入到EBV_genome文件目录中,我们可以查看一下具体内容。
$ tree
.
|-- EBV_genome.fasta
`-- mkref.sh
第二步, 使用mkref指令构建EB病毒参考基因组索引文件。
$ vim mkref.sh
celescope capture_virus mkref \
--genome_name EBV \
--fasta EBV_genome.fasta \
--genomeSAindexNbases 7
# --dry_run #该指令不运行,该指令指只写入config file,然后退出。
$ tree
.
|-- EBV_genome.fasta
|-- Genome
|-- Log.out
|-- SA
|-- SAindex
|-- celescope_genome.config
|-- chrLength.txt
|-- chrName.txt
|-- chrNameLength.txt
|-- chrStart.txt
|-- genomeParameters.txt
`-- mkref.sh
一个是配置 mapfile文件--mapfile 是multi_capture_virus下的参数,需要提供一个制表符分隔 (tab-delimited) 的文本文件。mapfile 的每一行代表双端 (paired-end) fastq文件。
$ cat EBV.mapfile
capture_virus /../celescope_test/celescope_test_data/capture_virus/fastq capture_virus_test /../celescope_test/celescope_test_data/capture_virus/fake_match_dir
第一列: capture_virus_fastq_ID:对应 capture_virus_fastq文件的名称前缀 第二列: capture_virus_datapath:对应 capture_virus_fastq文件的路径 第三列: capture_virus_name:对应质控报告的名称 第四列:对应与其“配对的”单细胞转录组分析 “fake_match_dir” 路径
另一个是 shell 脚本文件:EBV_run.sh
$ vim EBV_run.sh
multi_capture_virus\
--mapfile ./EBV.mapfile \
--virus_genomeDir /mnt/sdd/singleron_training_class/resources/celescope_test/celescope_test_data/capture_virus/EBV_genome \
--not_consensus \
--mod shell
(1)运行刚编辑好的shell脚本`EBV_run.sh。
$ sh EBV_run.sh
(2)运行完以后就可以自动生成一个名称为shell的文件目录。
$ tree -L 1
.
|-- EBV.mapfile
|-- EBV_run.sh
`-- shell
shell文件夹中会有一个以capture_virus_test命名的脚本运行存储数据的目录,以及一个运行的shell脚本capture_virus_test.sh,capture_virus_test.sh脚本中的每行指令对应每一步分析(质控报告的每一部分数据)。
进入到shell目录中,就可以运行脚本capture_virus_test.sh,然后在终端命令行中输入sh capture_virus_test.sh。那么程序就会在当前的终端界面运行。但是,如果在当前的终端界面中进行运行,终端界面就不能关闭,也不能掉线,否则运行的程序就会中断。那么,为了避免这种情况发生,我们可以使用nohup将运行脚本投递后台运行,执行nohup sh capture_virus_test.sh &,并生成一个nohup.out运行的日志文件。
$ tree -L 1
.
|-- capture_virus_test
|-- capture_virus_test.sh
`-- nohup.out
如果对每一步做了什么感兴趣,可以单独运行查看,capture_virus_test.sh里面是:
$ cat capture_virus_test1.sh
celescope capture_virus sample --outdir .//capture_virus_test1/00.sample --sample capture_virus_test1 --assay capture_virus --thread 4 --chemistry auto --fq1 /mnt/sdd/singleron_training_class/resources/celescope_test/celescope_test_data/capture_virus/fastq/capture_virus_1.fq.gz
celescope capture_virus barcode --outdir .//capture_virus_test1/01.barcode --sample capture_virus_test1 --assay capture_virus --thread 4 --chemistry auto --lowNum 2 --fq1 /mnt/sdd/singleron_training_class/resources/celescope_test/celescope_test_data/capture_virus/fastq/capture_virus_1.fq.gz --fq2 /mnt/sdd/singleron_training_class/resources/celescope_test/celescope_test_data/capture_virus/fastq/capture_virus_2.fq.gz
celescope capture_virus cutadapt --outdir .//capture_virus_test1/02.cutadapt --sample capture_virus_test1 --assay capture_virus --thread 4 --minimum_length 20 --nextseq_trim 20 --overlap 10 --insert 150 --fq .//capture_virus_test1/01.barcode/capture_virus_test1_2.fq
celescope capture_virus consensus --outdir .//capture_virus_test1/03.consensus --sample capture_virus_test1 --assay capture_virus --thread 4 --threshold 0.5 --not_consensus --min_consensus_read 1 --fq .//capture_virus_test1/02.cutadapt/capture_virus_test1_clean_2.fq
celescope capture_virus star_virus --outdir .//capture_virus_test1/04.star_virus --sample capture_virus_test1 --assay capture_virus --thread 4 --outFilterMultimapNmax 1 --starMem 30 --virus_genomeDir /mnt/sdd/singleron_training_class/resources/celescope_test/celescope_test_data/capture_virus/EBV_genome --fq .//capture_virus_test1/02.cutadapt/capture_virus_test1_clean_2.fq
celescope capture_virus count_virus --outdir .//capture_virus_test1/05.count_virus --sample capture_virus_test1 --assay capture_virus --thread 4 --min_query_length 35 --capture_bam .//capture_virus_test1/04.star_virus/capture_virus_test1_virus_Aligned.sortedByCoord.out.bam --match_dir /mnt/sdd/singleron_training_class/resources/celescope_test/celescope_test_data/capture_virus/fake_match_dir
celescope capture_virus filter_virus --outdir .//capture_virus_test1/06.filter_virus --sample capture_virus_test1 --assay capture_virus --thread 4 --min_support_reads 2 --umi_threshold_method auto --match_dir /mnt/sdd/singleron_training_class/resources/celescope_test/celescope_test_data/capture_virus/fake_match_dir --raw_read_count_file .//capture_virus_test1/05.count_virus/capture_virus_test1_raw_read_count.json
celescope capture_virus analysis_virus --outdir .//capture_virus_test1/07.analysis_virus --sample capture_virus_test1 --assay capture_virus --thread 4 --filter_tsne_file .//capture_virus_test1/06.filter_virus/capture_virus_test1_filtered_UMI_tsne.csv
$ tree
.
|-- 00.sample
| `-- stat.txt
|-- 01.barcode
| |-- capture_virus_test1_2.fq
| `-- stat.txt
|-- 02.cutadapt
| |-- capture_virus_test1_clean_2.fq
| |-- cutadapt.log
| `-- stat.txt
|-- 04.star_virus
| |-- capture_virus_test1_virus_Aligned.out.bam
| |-- capture_virus_test1_virus_Aligned.sortedByCoord.out.bam
| |-- capture_virus_test1_virus_Aligned.sortedByCoord.out.bam.bai
| |-- capture_virus_test1_virus_Log.final.out
| |-- capture_virus_test1_virus_Log.out
| |-- capture_virus_test1_virus_Log.progress.out
| |-- capture_virus_test1_virus_SJ.out.tab
| `-- stat.txt
|-- 05.count_virus
| |-- capture_virus_test1_raw_read_count.json
| `-- stat.txt
|-- 06.filter_virus
| |-- capture_virus_test1_filtered_UMI_tsne.csv
| `-- stat.txt
|-- 07.analysis_virus
| `-- stat.txt
`-- capture_virus_test1_report.html
当我们运行完以后,就可以得到一个单细胞EB病毒基因检测分析的网页报告。
以上就是一个完整的新格元单细胞EB病毒基因检测分析过程,接下来就可以进行FocuSCOPE®单细胞EB病毒基因检测数据的分析了。
本文仅做软件安装测试使用,更多软件更新信息参见:https://github.com/singleron-RD/CeleScope
电 话:025-58165529
业务咨询:025-58165526
售后电话:025-58862675
电子邮件:singleron@singleronbio.com
售后邮箱:product-service-support@singleronbio.com
地 址:南京市江北新区药谷大道11号加速器二期06栋3-5层
Copyright © 2021 新格元生物科技
网站建设:华科互动