#生物信息学 #fastq #cli

app bio-jtools

一套用于交互式高通量测序(HTS)数据的生物信息学工具

2 个不稳定版本

2022.6.6 2022年6月7日
2021.1.21 2021年1月21日
2020.10.21 2020年10月21日
2020.6.11 2020年6月11日
0.1.5 2020年10月21日

#177 in 生物学

每月 39 次下载

MIT 许可证

83KB
1.5K SLoC

bio-jtools-rs

一套用于交互式高通量测序(HTS)数据的生物信息学工具,完全用 Rust 编写

Crates.io

套件

info

提取并打印 HTS 文件的相关元数据。对于 FASTQ 文件,包括碱基数、记录数以及所有记录来源的仪器。

filter

根据查询名称过滤 HTS 文件。目前仅针对 SAM/BAM 文件实现

jaccard

计算一组 BED 文件中每对的 Jaccard 指数。如果指定,可以将其保存为逗号分隔的文件。

org

组织一批原始测序数据。

这需要直接从 Illumina 测序仪获取的包含 FASTQ 文件的文件夹,并按以下方式组织,以便进行对齐和质量控制。

YYMMDD_INSTID_RUN_FCID/
├── FASTQs/                     # home for your raw data
    ├── Sample1_R1.fastq.gz
    ├── Sample1_R2.fastq.gz
    └── ...
├── Aligned/                    # a home for your aligned data
├── Reports/                    # QC reports, etc files
├── config.tsv                  # a table of samples (rows) x features (cols)
├── cluster.yaml                # a yaml file of cluster parameters for jobs in the Snakefile
├── README.md                   # description of the folder, data contents
├── setup.log                   # a log of what operations were performed with `bjt org`
└── Snakefile                   # Snakemake workflow file

依赖项

~9–23MB
~291K SLoC