2 个不稳定版本
2022.6.6 |
|
---|---|
2021.1.21 |
|
2020.10.21 |
|
2020.6.11 |
|
0.1.5 | 2020年10月21日 |
#177 in 生物学
每月 39 次下载
83KB
1.5K SLoC
bio-jtools-rs
一套用于交互式高通量测序(HTS)数据的生物信息学工具,完全用 Rust 编写
套件
info
提取并打印 HTS 文件的相关元数据。对于 FASTQ 文件,包括碱基数、记录数以及所有记录来源的仪器。
filter
根据查询名称过滤 HTS 文件。目前仅针对 SAM/BAM 文件实现
jaccard
计算一组 BED 文件中每对的 Jaccard 指数。如果指定,可以将其保存为逗号分隔的文件。
org
组织一批原始测序数据。
这需要直接从 Illumina 测序仪获取的包含 FASTQ 文件的文件夹,并按以下方式组织,以便进行对齐和质量控制。
YYMMDD_INSTID_RUN_FCID/
├── FASTQs/ # home for your raw data
├── Sample1_R1.fastq.gz
├── Sample1_R2.fastq.gz
└── ...
├── Aligned/ # a home for your aligned data
├── Reports/ # QC reports, etc files
├── config.tsv # a table of samples (rows) x features (cols)
├── cluster.yaml # a yaml file of cluster parameters for jobs in the Snakefile
├── README.md # description of the folder, data contents
├── setup.log # a log of what operations were performed with `bjt org`
└── Snakefile # Snakemake workflow file
依赖项
~9–23MB
~291K SLoC