#生物信息学 #模糊匹配 #CSV #鲁棒 #vcf #rbt

app rust-bio-tools

基于Rust-Bio的一系列快速、鲁棒的生物信息学任务命令行实用工具

86次发布

0.42.2 2024年4月10日
0.42.0 2023年1月18日
0.41.0 2022年8月23日
0.40.0 2022年7月21日
0.2.4 2018年3月6日

#11 in 生物学

Download history 2/week @ 2024-05-23 480/week @ 2024-07-25 57/week @ 2024-08-01

537次每月下载

自定义许可GPL-3.0+

3MB
8K SLoC

Rust 7K SLoC // 0.0% comments Tera 870 SLoC // 0.0% comments JavaScript 330 SLoC // 0.1% comments

Gitpod Ready-to-Code Bioconda downloads Bioconda version install with bioconda Licence GitHub Workflow Status

Rust-Bio-Tools

基于Rust-Bio的一系列超快速、鲁棒的生物信息学任务命令行实用工具。Rust-Bio-Tools提供rbt命令,目前支持以下操作

  • 两个vcf/bcf文件的模糊匹配的线性时间实现 (rbt vcf-match)
  • vcf/bcf到txt的转换器,可以灵活选择标签并正确处理多态位点 (rbt vcf-to-txt)
  • 线性时间的FASTQ轮询分割器,将给定的FASTQ文件分割成指定数量的块 (rbt fastq-split)
  • 在给定位点从BAMs中提取深度信息的线性时间实现 (rbt bam-depth)
  • 从FASTQ文件中快速过滤记录的实用工具 (rbt fastq-filter)
  • 使用标记重复或独特的分子标识符(UMI)合并BAM或FASTQ读取的工具 (rbt collapse-reads-to-fragments bam|fastq)
  • 生成基于HTML的交互式报告的工具,提供多个图表可视化提供的VCF和BAM格式的基因组数据 (rbt vcf-report)
  • 一个从csv文件生成交互式HTML报告的工具,包括可视化(rbt csv-report
  • 一个工具,可以将VCF/BCF文件分割成N个相等的块,包括BND支持(rbt vcf-split
  • 一个工具,可以生成包含单个HTML文件的给定参考中包含的BAM文件中特定区域的可视化(rbt plot-bam

根据作者的需求添加了更多功能。如果您想自己做出贡献,请查看贡献部分。要查看变更列表,请参阅CHANGELOG

安装

需求

Rust-Bio-Tools依赖于rgsl,该依赖需要安装GSL

  • Ubuntu: sudo apt-get install libgsl-dev
  • Arch: sudo pacman -S gsl
  • OSX: brew install gsl

Bioconda

Rust-Bio-Tools可通过Bioconda获得。设置好Bioconda后,安装过程就像

conda install rust-bio-tools

Cargo

如果已安装Rust编译器和相关的Cargo,则可以通过以下方式安装Rust-Bio-Tools:

cargo install rust-bio-tools

源代码

下载源代码,然后在源代码根目录下运行

cargo install

用法和文档

Rust-Bio-Tools安装了一个命令行工具rbt。输入

rbt --help

以获取所有选项和工具的摘要。

贡献

欢迎任何贡献。如果您计划做出贡献,我们建议安装pre-commit钩子。为此

  1. 此处所述安装pre-commit
  2. 在rust-bio-tools基础目录中运行pre-commit install

这应该会在提交时格式化、检查和清理您的代码。

作者

依赖项

~87MB
~1.5M SLoC