EN
SCOPE-chip微流控芯片分析软件SCelLiVe®组织保存液和解离液FocuSCOPE®靶向高通量单细胞测序

首页 > 产品与技术 > 核心技术 > 分析软件 > 软件教程

FocuSCOPE®单细胞肺癌靶向基因突变数据分析

一、简介

随着单细胞技术的飞速进展,单细胞转录组,单细胞免疫受体,空间转录组技术等先后出现,从多种角度为我们提供细胞层面的表达信息。很多癌症常伴有一系列基因突变,如EGFR、BRAF、ALK、NRAS等。针对这些特定基因突变的靶向药物治疗因其副作用小、疗效显著而受到人们的普遍欢迎,在单细胞水平对这些基因进行靶向测序将有助于临床研究。

新格元FocuSCOPE®靶向高通量单细胞测序技术可以对突变基因、融合基因、病毒与宿主RNA等研究热点的区域进行特异性捕获研究。

FocuSCOPE®单细胞肺癌靶向基因突变检测试剂盒能完成单细胞捕获、细胞裂解、分子标签标记、细胞mRNA捕获、肺癌靶基因靶突变位点富集文库的构建全流程实验。肺癌靶向捕获区域覆盖EGFR、BRAF、KRAS、NRAS、HRAS、PIK3CA基因的热点突变区段。

二、原理

采用独特性的分子标签磁珠设计,在寡核苷酸序列上加入了靶向目标位点区域3’端的特异性探针,继而实现对目标区域信息的高效获取,同时通过特异性引物进行多重PCR扩增富集,进一步提高对目标区域进行的测序分析。

FocuSCOPE®优势
单细胞肺癌靶向基因突变检测专注于解决传统测序中尚未解决的问题

  • 突破基因位置限制 基于特异性磁珠设计,可有效捕获目标基因信息
  • 获得信息更全面 同时获得一个细胞的全转录组数据和靶向基因检测数据
  • 目标基因设定灵活 可检测已知靶基因,也可接受个性化定制

 

三、应用场景

  • 多角度研究不同肺癌亚型及患者间肿瘤异质性;
  • 解析肺癌微环境;
  • 监测肺癌发展、复发过程中的突变动态;
  • 监测不同驱动突变下的肺癌演化路径;
  • 分析用药前后、单药与联合用药的热点突变和细胞比例变化;
  • 探究治疗方案与突变的潜在联系;辅助临床治疗策略;
  • 辅助分子分型的诊断;
  • 探究疾病发生发展机制;

 

四、产品优势

  • 高效捕获靶向区域:特异性探针设计,可提高靶向捕获基因效率
  • 肺癌瘤内异质性:单细胞转录组与靶基因同时捕获,了解肺癌组织异质性
  • 肺癌靶药突变覆盖率高:覆盖超60%肺癌靶向药物敏感性及耐药性突变区域
  • 靶向基因表达丰度:无偏检测细胞内靶基因的表达值
  • 单细胞分辨率:在单细胞层面研究肺癌特定突变型/共突变型信息,探究肺癌驱动突变以及耐药突变机制
  • Biomarker探索:实现不同突变模式下,肺癌用药疗效及预后标志物探索

 

五、celescope FocuSCOPE 分析流程

FocuSCOPE生成的单细胞转录动态监测数据的基本流程。
FocuSCOPE pipeline (单细胞FocuSCOPE®单细胞肺癌靶向基因突变检测数据分析) 包含10个主要指令,可以通过 celescope snp {指令} --help 查看:

$ celescope snp --help
usage: celescope snp [-h]
                     {mkref,sample,barcode,cutadapt,consensus,star,featureCounts,target_metrics,variant_calling,filter_snp,analysis_snp}
                     ...

Single-cell snp

positional arguments:
  {mkref,sample,barcode,cutadapt,consensus,star,featureCounts,target_metrics,variant_calling,filter_snp,analysis_snp}

optional arguments:
  -h, --help            show this help message and exit

下载测试数据与脚本 为了便于测试软件,我们在github上托管了测试数据(请注意,这些数据仅供测试用途,部分数据是人为生成的)。

mkdir test_dir
cd test_dir
git clone https://github.com/singleron-RD/celescope_test_data.git
git clone https://github.com/singleron-RD/celescope_test_script.git

当然,也可以在gitee上下载:

mkdir test_dir
cd test_dir
git clone https://gitee.com/singleron-rd/celescope_test_data.git
git clone https://gitee.com/singleron-rd/celescope_test_script.git

所有的软件DEMO测试数据我们已经在celescope rna的教程中下载过,这里可以看一下snp数据的结构,让我们看一看下载的测试数据与脚本。

$ tree 
.
|-- run_shell.sh
`-- snp.mapfile

 

六、FocuSCOPE®单细胞肺癌靶向基因突变检测分析流程实操

单细胞肺癌靶向基因突变检测研究在实验过程中会构建一个转录组文库和肺癌靶基因序列富集,因此数据分析也分为两个环节:
(1) 单细胞转录组分析
(2) 肺癌靶基因序列富集
本篇文章内只介绍单细胞肺癌靶基因序列富集 ,而celescope分析单细胞转录组数据的教程已在前期中介绍过。在分析之前我们先要激活我们celescope软件的运行环境,可以使用conda activate celescope命令进行激活。

(base) singleron 13:20:48 /../snp
$ conda activate celescope 
(celescope) singleron 13:21:18 /../snp

 

1、用celescope snp mkref构建SNP参考基因组目录

SNP参考基因组目录的构建需要在之前已经构建好的转录组参考基因组目录中进行,使用celescope snp mkref命令构建。

celescope snp mkref \
--genome_name Homo_sapiens_ensembl_99 \
--fasta Homo_sapiens.GRCh38.dna.primary_assembly.fa`-- snp.mapfile

需要注意的是:celescope snp mkref命令会更新celescope_genome.config内的genome_type,将其从rna改为snp,需要先备份转录组构建的celescope_genome.config文件。

接下来就是要使用的2个重要的配置文件,snp.mapfile和run_shell.sh。

$ tree -L 1
.
|-- run_shell.sh
`-- snp.mapfile--fasta Homo_sapiens.GRCh38.dna.primary_assembly.fa

 

2、用 multi_snp构建celescope snp 分析的 shell 脚本

配置 mapfile文件 --mapfile 是multi_snp下的参数,需要提供一个制表符分隔 (tab-delimited) 的文本文件。mapfile 的每一行代表双端 (paired-end) fastq文件。

snp  /../celescope_test_data/snp/fastqs  snp_test1  /../celescope_test_data/snp/snp_match_dir

  • 第一列: snp_fastq_ID:对应 snp_fastq文件的名称前缀
  • 第二列: snp_datapath:对应 snp_fastq文件的路径
  • 第三列: snp_sample_name:对应质控报告的名称
  • 第四列:对应与其“配对的”单细胞转录组分析 “snp_match_dir” 路径

另一个是 shell 脚本文件:run_shell.sh

$ cat run_shell.sh 
multi_snp \
 --mapfile ./snp.mapfile \
 --genomeDir /../ref_lib/Homo_Sapiens/Homo_GRCh38_GenomeDir \ #snp mkref创建的参考基因组目录(路径)
 --mod shell \
 --not_consensus \
 --panel lung_1
 # 如果增加参数“--not_consensus”,分析过程中将不会生成consensus相关目录

 

3、生成shell脚本

(1)运行刚编辑好的shell脚本run_shell.sh

$ sh run_shell.sh

(2)运行完以后就可以自动生成一个名称为shell的文件目录。

$ tree -L 1
.
|-- run_shell.sh
|-- shell
`-- snp.mapfile

shell文件夹中会有一个以snp_test命名的脚本运行存储数据的目录,以及一个运行的shell脚本snp_test.sh,snp_test.sh脚本中的每行指令对应每一步分析(质控报告的每一部分数据)。

 

4、投递shell脚本

进入到shell目录中,就可以运行脚本snp_test.sh,然后在终端命令行中输入sh snp_test.sh。那么程序就会在当前的终端界面运行。但是,如果在当前的终端界面中进行运行,终端界面就不能关闭,也不能掉线,否则运行的程序就会中断。那么,为了避免这种情况发生,我们可以使用nohup将运行脚本投递后台运行,执行nohup sh snp_test.sh &,并生成一个nohup.out运行的日志文件。

$ tree -L 1
.
|-- snp_test
|-- snp_test.sh
`-- nohup.out

如果对每一步做了什么感兴趣,可以单独运行查看,snp_test.sh 里面是:

(celescope) singleron /../snp/shell
$ cat snp_test1.sh 
celescope snp sample --outdir .//test1/00.sample --sample test1 --thread 4 --chemistry auto --fq1 /mnt/sdd/Singleron/bioinfo_test_data_and_script/celescope_test_data/snp/fastqs/snp1_1.fq.gz
celescope snp barcode --outdir .//test1/01.barcode --sample test1 --thread 4 --chemistry auto --lowNum 2 --fq1 /mnt/sdd/Singleron/bioinfo_test_data_and_script/celescope_test_data/snp/fastqs/snp1_1.fq.gz --fq2 /mnt/sdd/Singleron/bioinfo_test_data_and_script/celescope_test_data/snp/fastqs/snp1_2.fq.gz
celescope snp cutadapt --outdir .//test1/02.cutadapt --sample test1 --thread 4 --minimum_length 20 --nextseq_trim 20 --overlap 10 --insert 150 --fq .//test1/01.barcode/test1_2.fq
celescope snp consensus --outdir .//test1/03.consensus --sample test1 --thread 4 --threshold 0.5 --not_consensus --min_consensus_read 1 --fq .//test1/02.cutadapt/test1_clean_2.fq
celescope snp star --outdir .//test1/04.star --sample test1 --thread 4 --genomeDir /mnt/sdd/singleron_training_class/resources/ref_lib/Homo_GRCh38_99 --outFilterMultimapNmax 1 --starMem 30 --fq .//test1/02.cutadapt/test1_clean_2.fq
celescope snp featureCounts --outdir .//test1/05.featureCounts --sample test1 --thread 4 --gtf_type gene --genomeDir /mnt/sdd/singleron_training_class/resources/ref_lib/Homo_GRCh38_99 --input .//test1/04.star/test1_Aligned.sortedByCoord.out.bam
celescope snp target_metrics --outdir .//test1/06.target_metrics --sample test1 --thread 4 --panel lung_1 --bam .//test1/05.featureCounts/test1_Aligned.sortedByCoord.out.bam.featureCounts.bam --match_dir /mnt/sdd/Singleron/bioinfo_test_data_and_script/celescope_test_data/snp/snp_match_dir --add_RG
celescope snp variant_calling --outdir .//test1/07.variant_calling --sample test1 --thread 4 --genomeDir /mnt/sdd/singleron_training_class/resources/ref_lib/Homo_GRCh38_99 --panel lung_1 --bam .//test1/06.target_metrics/test1_filtered_sorted.bam --match_dir /mnt/sdd/Singleron/bioinfo_test_data_and_script/celescope_test_data/snp/snp_match_dir
celescope snp filter_snp --outdir .//test1/08.filter_snp --sample test1 --thread 4 --threshold_method otsu --vcf .//test1/07.variant_calling/test1_norm.vcf
celescope snp analysis_snp --outdir .//test1/09.analysis_snp --sample test1 --thread 4 --database GRCh38.99 --panel lung_1 --match_dir /mnt/sdd/Singleron/bioinfo_test_data_and_script/celescope_test_data/snp/snp_match_dir --vcf .//test1/08.filter_snp/test1_filtered.vcf

 

5、结果目录

$ tree
.
├── 00.sample
│   └── stat.txt
├── 01.barcode
│   ├── stat.txt
│   └── test1_2.fq
├── 02.cutadapt
│   ├── cutadapt.log
│   ├── stat.txt
│   └── test1_clean_2.fq
├── 04.star
│   ├── stat.txt
│   ├── test1_Aligned.out.bam
│   ├── test1_Aligned.sortedByCoord.out.bam
│   ├── test1_Aligned.sortedByCoord.out.bam.bai
│   ├── test1_Log.final.out
│   ├── test1_Log.out
│   ├── test1_Log.progress.out
│   └── test1_SJ.out.tab
├── 05.featureCounts
│   ├── stat.txt
│   ├── test1
│   ├── test1_Aligned.sortedByCoord.out.bam.featureCounts.bam
│   ├── test1_name_sorted.bam
│   └── test1.summary
├── 06.target_metrics
│   ├── stat.txt
│   ├── test1_filtered.bam
│   ├── test1_filtered_sorted.bam
│   └── test1_filtered_sorted.bam.bai
├── 07.variant_calling
│   ├── stat.txt
│   ├── test1_norm.vcf
│   ├── test1_raw.bcf
│   ├── test1_raw.vcf
│   ├── test1_splitN.bai
│   └── test1_splitN.bam
├── 08.filter_snp
│   ├── stat.txt
│   └── test1_filtered.vcf
├── 09.analysis_snp
│   ├── snpEff
│   │   ├── snpEff_genes.txt
│   │   ├── snpEff_summary.html
│   │   └── variants_ann.vcf
│   ├── stat.txt
│   ├── test1_gt.csv
│   ├── test1_variant_ncell.csv
│   └── test1_variant_table.csv
└── test1_report.html

当我们运行完以后,就可以得到一个单细胞肺癌靶向基因突变检测分析的网页报告。

  • 质控报告的样本和软件的基本信息
  • 数据质控信息
  • 基因组比对信息
  • 细胞与基因定量情况
  • 靶向基因的突变信息

好啦,以上就是一个完整的新格元单细胞肺癌靶向基因突变检测分析过程,接下来就可以进行肺癌基因突变的分析啦。

本文仅做软件安装测试使用,更多软件更新信息参见:https://github.com/singleron-RD/CeleScope

联系我们
  • 微信公众号
  • 售后公众号