细胞膜糖基化在细胞识别中发挥重要作用,有研究者将其比喻为细胞的“面具”、“面膜”或“糖衣”。作为一种常见的蛋白翻译后修饰,糖基化在真核细胞中广泛存在,不同细胞类型的糖基化在类型和数量上也有较强的异质性。糖基化的基本过程是在糖基转移酶作用下将糖类转移至蛋白质,与蛋白质上特殊的氨基酸残基形成糖苷键。新格元开发了高通量单细胞糖基化检测试剂盒,可以在单细胞分辨率下同时检测单细胞转录组和细胞表面糖基化。基于酶促糖基化原理,在测序前经过糖基转移酶连接Tag,使用Singleron Barcode Beads可完成对单细胞Tag标签及转录组的捕获,通过标签文库及转录组的联合分析,可同时获得单样本的细胞转录组信息及细胞糖基化信息。
sweetseq pipeline(ProMoSCOPE®单细胞糖基化)包含6个主要指令,可以通过celescope sweetseq -h查看:
$ celescope sweetseq -h
usage: celescope sweetseq [-h] {sample,barcode,cutadapt,mapping_tag,count_tag,analysis_tag} ...
Single-cell sweetseq
positional arguments:
{sample,barcode,cutadapt,mapping_tag,count_tag,analysis_tag}
optional arguments:
-h, --help show this help message and exit
$ celescope -v
1.14.1
下载测试数据与脚本
这些数据都是我们托管在GitHub上的测试数据,部分数据是人为生成的,仅供测试。
git clone https://github.com/singleron-RD/celescope_test_data.git
git clone https://github.com/singleron-RD/celescope_test_script.git
我们看一下测试数据与脚本的结构
# 测试数据
$ tree
.
├── fake_match_dir
│ ├── 05.count
│ │ └── fake_filtered_feature_bc_matrix
│ │ └── barcodes.tsv
│ └── 06.analysis
│ ├── fake_markers.tsv
│ └── fake_tsne_coord.tsv
├── fastqs
│ ├── test1_1.fq.gz
│ └── test1_2.fq.gz
├── sweet_tag_barcode.fasta
└── sweet_tag_linker.fasta
# 脚本
$ tree
.
├── run_shell.sh
└── sweetseq.mapfile
单细胞糖基化检测在实验过程中会构建一个单细胞转录组文库和一个糖基化标签文库,因此数据分析也分为两个部分:
本篇文章内只介绍单细胞糖基化检测分析流程,而CeleScope分析单细胞转录组数据的教程已在前期中介绍过。
接下来,整个分析流程需要使用到分析流程中最重要的两个配置文件,sweetseq.mapfile和run_shell.sh
配置mapfile文件:--mapfile是multi_sweetseq下的参数,需要提供一个制表符分隔 (tab-delimited) 的文本文件。mapfile 的每一行代表双端(paired-end)fastq文件。
$ cat sweetseq.mapfile
test1 ../../celescope_test_data/sweetseq/fastqs test1 ../../celescope_test_data/sweetseq/fake_match_dir/
配置shell脚本文件:run_shell.sh
$ cat run_shell.sh
multi_sweetseq \
--mapfile ./sweetseq.mapfile \
--linker_fasta ../../celescope_test_data/sweetseq/sweet_tag_linker.fasta \
--barcode_fasta ../../celescope_test_data/sweetseq/sweet_tag_barcode.fasta \
--fq_pattern L23C15 \
--mod shell\
sh run_shell.sh
$ tree -L
.
├── run_shell.sh
├── shell
│ └── test1.sh
└── sweetseq.mapfile
shell目录里存在一个脚本叫做 test1.sh,脚本中的每行指令都对应一步分析,也会在结果目录中生成一个目录。
$ cat test1.sh
celescope sweetseq sample --outdir .//test1/00.sample --sample test1 --thread 4 --chemistry auto --fq1 ../../celescope_test_data/sweetseq/fastqs/test1_1.fq.gz
celescope sweetseq barcode --outdir .//test1/01.barcode --sample test1 --thread 4 --chemistry auto --lowNum 2 --fq1 ../../celescope_test_data/sweetseq/fastqs/test1_1.fq.gz --fq2 ../../celescope_test_data/sweetseq/fastqs/test1_2.fq.gz
celescope sweetseq cutadapt --outdir .//test1/02.cutadapt --sample test1 --thread 4 --minimum_length 20 --nextseq_trim 20 --overlap 10 --insert 150 --fq .//test1/01.barcode/test1_2.fq
celescope sweetseq mapping_tag --outdir .//test1/03.mapping_tag --sample test1 --thread 4 --fq_pattern L23C15 --barcode_fasta ../../celescope_test_data/sweetseq/sweet_tag_barcode.fasta --linker_fasta ../../celescope_test_data/sweetseq/sweet_tag_linker.fasta --fq .//test1/02.cutadapt/test1_clean_2.fq
celescope sweetseq count_tag --outdir .//test1/04.count_tag --sample test1 --thread 4 --match_dir ../../celescope_test_data/sweetseq/fake_match_dir/ --read_count_file .//test1/03.mapping_tag/test1_read_count.tsv
celescope sweetseq analysis_tag --outdir .//test1/05.analysis_tag --sample test1 --thread 4 --match_dir ../../celescope_test_data/sweetseq/fake_match_dir/ --tsne_tag_file .//test1/04.count_tag/test1_tsne_tag.tsv
进入shell目录后,可以运行脚本 test1.sh,即在命令行中输入 sh run_shell.sh。程序就会在当前界面运行,但这种投递方式存在一些弊端:终端界面不能关闭,不能断网离线,否则运行的程序就会中断。为了避免这种经情况的发生,我们可以使用nohup命令将运行脚本投递到后台运行,使用 nohup test1.sh &命令,同时生成 test1 目录与 nohup.out 运行日志文件。
$ tree -L 1
.
├── nohup.out
├── test1
└── test1.sh
$ tree
.
├── 00.sample
│ └── stat.txt
├── 01.barcode
│ ├── stat.txt
│ └── test1_2.fq
├── 02.cutadapt
│ ├── cutadapt.log
│ ├── stat.txt
│ └── test1_clean_2.fq
├── 03.mapping_tag
│ ├── stat.txt
│ ├── test1_invalid_barcode.tsv
│ └── test1_read_count.tsv
├── 04.count_tag
│ ├── stat.txt
│ ├── test1_tsne_tag.tsv
│ └── test1_umi_tag.tsv
├── 05.analysis_tag
│ └── stat.txt
└── test1_report.html
当我们运行完成后,会得到一个单细胞糖基化检测分析的网页报告:test1_report.html。
网页报告中包括以下信息:
本文仅做软件安装测试使用,更多软件更新信息参见:https://github.com/singleron-RD/CeleScope
电 话:025-58165529
业务咨询:025-58165526
售后电话:025-58862675
电子邮件:singleron@singleronbio.com
售后邮箱:product-service-support@singleronbio.com
地 址:南京市江北新区药谷大道11号加速器二期06栋3-5层
Copyright © 2021 新格元生物科技
网站建设:华科互动