随着单细胞技术的飞速进展,单细胞转录组,单细胞免疫受体,空间转录组技术等先后出现,从多种角度为我们提供细胞层面的表达信息。很多癌症常伴有一系列基因突变,如EGFR、BRAF、ALK、NRAS等。针对这些特定基因突变的靶向药物治疗因其副作用小、疗效显著而受到人们的普遍欢迎,在单细胞水平对这些基因进行靶向测序将有助于临床研究。
新格元FocuSCOPE®靶向高通量单细胞测序技术可以对突变基因、融合基因、病毒与宿主RNA等研究热点的区域进行特异性捕获研究。
FocuSCOPE®单细胞肺癌靶向基因突变检测试剂盒能完成单细胞捕获、细胞裂解、分子标签标记、细胞mRNA捕获、肺癌靶基因靶突变位点富集文库的构建全流程实验。肺癌靶向捕获区域覆盖EGFR、BRAF、KRAS、NRAS、HRAS、PIK3CA基因的热点突变区段。
采用独特性的分子标签磁珠设计,在寡核苷酸序列上加入了靶向目标位点区域3’端的特异性探针,继而实现对目标区域信息的高效获取,同时通过特异性引物进行多重PCR扩增富集,进一步提高对目标区域进行的测序分析。
FocuSCOPE®优势
单细胞肺癌靶向基因突变检测专注于解决传统测序中尚未解决的问题
FocuSCOPE生成的单细胞转录动态监测数据的基本流程。
FocuSCOPE pipeline (单细胞FocuSCOPE®单细胞肺癌靶向基因突变检测数据分析) 包含10
个主要指令,可以通过 celescope snp {指令} --help 查看:
$ celescope snp --help
usage: celescope snp [-h]
{mkref,sample,barcode,cutadapt,consensus,star,featureCounts,target_metrics,variant_calling,filter_snp,analysis_snp}
...
Single-cell snp
positional arguments:
{mkref,sample,barcode,cutadapt,consensus,star,featureCounts,target_metrics,variant_calling,filter_snp,analysis_snp}
optional arguments:
-h, --help show this help message and exit
下载测试数据与脚本 为了便于测试软件,我们在github上托管了测试数据(请注意,这些数据仅供测试用途,部分数据是人为生成的)。
mkdir test_dir
cd test_dir
git clone https://github.com/singleron-RD/celescope_test_data.git
git clone https://github.com/singleron-RD/celescope_test_script.git
当然,也可以在gitee上下载:
mkdir test_dir
cd test_dir
git clone https://gitee.com/singleron-rd/celescope_test_data.git
git clone https://gitee.com/singleron-rd/celescope_test_script.git
所有的软件DEMO测试数据我们已经在celescope rna的教程中下载过,这里可以看一下snp数据的结构,让我们看一看下载的测试数据与脚本。
$ tree
.
|-- run_shell.sh
`-- snp.mapfile
单细胞肺癌靶向基因突变检测研究在实验过程中会构建一个转录组文库和肺癌靶基因序列富集,因此数据分析也分为两个环节:
(1) 单细胞转录组分析
(2) 肺癌靶基因序列富集
本篇文章内只介绍单细胞肺癌靶基因序列富集 ,而celescope分析单细胞转录组数据的教程已在前期中介绍过。在分析之前我们先要激活我们celescope软件的运行环境,可以使用conda activate celescope命令进行激活。
(base) singleron 13:20:48 /../snp
$ conda activate celescope
(celescope) singleron 13:21:18 /../snp
celescope snp mkref
celescope snp mkref \
--genome_name Homo_sapiens_ensembl_99 \
--fasta Homo_sapiens.GRCh38.dna.primary_assembly.fa`-- snp.mapfile
celescope snp mkref
$ tree -L 1
.
|-- run_shell.sh
`-- snp.mapfile--fasta Homo_sapiens.GRCh38.dna.primary_assembly.fa
配置 mapfile文件 --mapfile 是multi_snp下的参数,需要提供一个制表符分隔 (tab-delimited) 的文本文件。mapfile 的每一行代表双端 (paired-end) fastq文件。
snp /../celescope_test_data/snp/fastqs snp_test1 /../celescope_test_data/snp/snp_match_dir
另一个是 shell 脚本文件:run_shell.sh
$ cat run_shell.sh
multi_snp \
--mapfile ./snp.mapfile \
--genomeDir /../ref_lib/Homo_Sapiens/Homo_GRCh38_GenomeDir \ #snp mkref创建的参考基因组目录(路径)
--mod shell \
--not_consensus \
--panel lung_1
# 如果增加参数“--not_consensus”,分析过程中将不会生成consensus相关目录
(1)运行刚编辑好的shell脚本run_shell.sh
$ sh run_shell.sh
(2)运行完以后就可以自动生成一个名称为shell的文件目录。
$ tree -L 1
.
|-- run_shell.sh
|-- shell
`-- snp.mapfile
shell文件夹中会有一个以snp_test命名的脚本运行存储数据的目录,以及一个运行的shell脚本snp_test.sh,snp_test.sh脚本中的每行指令对应每一步分析(质控报告的每一部分数据)。
进入到shell目录中,就可以运行脚本snp_test.sh,然后在终端命令行中输入sh snp_test.sh。那么程序就会在当前的终端界面运行。但是,如果在当前的终端界面中进行运行,终端界面就不能关闭,也不能掉线,否则运行的程序就会中断。那么,为了避免这种情况发生,我们可以使用nohup将运行脚本投递后台运行,执行nohup sh snp_test.sh &,并生成一个nohup.out运行的日志文件。
$ tree -L 1
.
|-- snp_test
|-- snp_test.sh
`-- nohup.out
如果对每一步做了什么感兴趣,可以单独运行查看,snp_test.sh 里面是:
(celescope) singleron /../snp/shell
$ cat snp_test1.sh
celescope snp sample --outdir .//test1/00.sample --sample test1 --thread 4 --chemistry auto --fq1 /mnt/sdd/Singleron/bioinfo_test_data_and_script/celescope_test_data/snp/fastqs/snp1_1.fq.gz
celescope snp barcode --outdir .//test1/01.barcode --sample test1 --thread 4 --chemistry auto --lowNum 2 --fq1 /mnt/sdd/Singleron/bioinfo_test_data_and_script/celescope_test_data/snp/fastqs/snp1_1.fq.gz --fq2 /mnt/sdd/Singleron/bioinfo_test_data_and_script/celescope_test_data/snp/fastqs/snp1_2.fq.gz
celescope snp cutadapt --outdir .//test1/02.cutadapt --sample test1 --thread 4 --minimum_length 20 --nextseq_trim 20 --overlap 10 --insert 150 --fq .//test1/01.barcode/test1_2.fq
celescope snp consensus --outdir .//test1/03.consensus --sample test1 --thread 4 --threshold 0.5 --not_consensus --min_consensus_read 1 --fq .//test1/02.cutadapt/test1_clean_2.fq
celescope snp star --outdir .//test1/04.star --sample test1 --thread 4 --genomeDir /mnt/sdd/singleron_training_class/resources/ref_lib/Homo_GRCh38_99 --outFilterMultimapNmax 1 --starMem 30 --fq .//test1/02.cutadapt/test1_clean_2.fq
celescope snp featureCounts --outdir .//test1/05.featureCounts --sample test1 --thread 4 --gtf_type gene --genomeDir /mnt/sdd/singleron_training_class/resources/ref_lib/Homo_GRCh38_99 --input .//test1/04.star/test1_Aligned.sortedByCoord.out.bam
celescope snp target_metrics --outdir .//test1/06.target_metrics --sample test1 --thread 4 --panel lung_1 --bam .//test1/05.featureCounts/test1_Aligned.sortedByCoord.out.bam.featureCounts.bam --match_dir /mnt/sdd/Singleron/bioinfo_test_data_and_script/celescope_test_data/snp/snp_match_dir --add_RG
celescope snp variant_calling --outdir .//test1/07.variant_calling --sample test1 --thread 4 --genomeDir /mnt/sdd/singleron_training_class/resources/ref_lib/Homo_GRCh38_99 --panel lung_1 --bam .//test1/06.target_metrics/test1_filtered_sorted.bam --match_dir /mnt/sdd/Singleron/bioinfo_test_data_and_script/celescope_test_data/snp/snp_match_dir
celescope snp filter_snp --outdir .//test1/08.filter_snp --sample test1 --thread 4 --threshold_method otsu --vcf .//test1/07.variant_calling/test1_norm.vcf
celescope snp analysis_snp --outdir .//test1/09.analysis_snp --sample test1 --thread 4 --database GRCh38.99 --panel lung_1 --match_dir /mnt/sdd/Singleron/bioinfo_test_data_and_script/celescope_test_data/snp/snp_match_dir --vcf .//test1/08.filter_snp/test1_filtered.vcf
$ tree
.
├── 00.sample
│ └── stat.txt
├── 01.barcode
│ ├── stat.txt
│ └── test1_2.fq
├── 02.cutadapt
│ ├── cutadapt.log
│ ├── stat.txt
│ └── test1_clean_2.fq
├── 04.star
│ ├── stat.txt
│ ├── test1_Aligned.out.bam
│ ├── test1_Aligned.sortedByCoord.out.bam
│ ├── test1_Aligned.sortedByCoord.out.bam.bai
│ ├── test1_Log.final.out
│ ├── test1_Log.out
│ ├── test1_Log.progress.out
│ └── test1_SJ.out.tab
├── 05.featureCounts
│ ├── stat.txt
│ ├── test1
│ ├── test1_Aligned.sortedByCoord.out.bam.featureCounts.bam
│ ├── test1_name_sorted.bam
│ └── test1.summary
├── 06.target_metrics
│ ├── stat.txt
│ ├── test1_filtered.bam
│ ├── test1_filtered_sorted.bam
│ └── test1_filtered_sorted.bam.bai
├── 07.variant_calling
│ ├── stat.txt
│ ├── test1_norm.vcf
│ ├── test1_raw.bcf
│ ├── test1_raw.vcf
│ ├── test1_splitN.bai
│ └── test1_splitN.bam
├── 08.filter_snp
│ ├── stat.txt
│ └── test1_filtered.vcf
├── 09.analysis_snp
│ ├── snpEff
│ │ ├── snpEff_genes.txt
│ │ ├── snpEff_summary.html
│ │ └── variants_ann.vcf
│ ├── stat.txt
│ ├── test1_gt.csv
│ ├── test1_variant_ncell.csv
│ └── test1_variant_table.csv
└── test1_report.html
当我们运行完以后,就可以得到一个单细胞肺癌靶向基因突变检测分析的网页报告。
好啦,以上就是一个完整的新格元单细胞肺癌靶向基因突变检测分析过程,接下来就可以进行肺癌基因突变的分析啦。
本文仅做软件安装测试使用,更多软件更新信息参见:https://github.com/singleron-RD/CeleScope
电 话:025-58165529
业务咨询:025-58165526
售后电话:025-58862675
电子邮件:singleron@singleronbio.com
售后邮箱:product-service-support@singleronbio.com
地 址:南京市江北新区药谷大道11号加速器二期06栋3-5层
Copyright © 2021 新格元生物科技
网站建设:华科互动