#fastq #friends #bioinformatics

bin+lib ross

用于对 fastq 文件进行基本分析的脚本集

2 个版本

使用旧的 Rust 2015

0.1.7 2018 年 4 月 20 日
0.1.6 2018 年 4 月 19 日

235生物学

MIT 许可证

115KB
1.5K SLoC

Build Status

序列随机操作套件 - ROSS

使用 Unix 流进行 fastq 文件上的随机操作

安装

ROSS.rs 使用 Rust 编程语言编写。有关 Rust 的更多信息,包括安装和可执行文件 cargo,请访问 rust-lang.org

下载后,使用 Rust 可执行文件 cargo 如下所示

cd ROSS.rs
cargo build --release

所有可执行文件都将位于目录 ROSS.rs/target/release 中。

通用用法

所有脚本都接受参数,从 stdin 读取未压缩的 fastq 格式,并将未压缩的 fastq 格式打印到 stdout。所有配对末端 fastq 文件必须以交错格式存在,并且它们以 交错格式 编写,除非使用 friends_joey 进行解乱序。

  • --帮助
  • --numcpus 并非所有脚本都会利用 numcpus。
  • --paired-end 输入读取是交错的配对末端
  • --verbose 打印更多状态消息

其他文档

  • 一些工作流程可以在 one-liners 页面上找到。
  • 一些包装脚本可以在 scripts 页面上找到。

Ross 脚本描述

脚本 描述
friends_monica 修剪和清洁一个 fastq 文件。她喜欢清洁。 Monica
friends_carol 将任何 fastq 文件转换为标准的每条条目四行格式。Carol 可以帮助你整理。 Carol
friends_rachel 打印基本的读取指标。Rachel 会告诉你你看起来有多好。 Rachel
friends_ung 确定配对末端。丑陋的裸体男人经历了很多审查。 UNG
friends_phoebe 随机化读取。Phoebe 完全随机。 Phoebe
friends_emma 组合相同的读取。你知道 Emma 是由双胞胎 Cali 和 Noelle Sheldon 扮演的吗?就像 Full House 中的 Michelle Tanner 一样! UNG
friends_chandler Kmer 计算。无外部依赖。Chandler 的工作很少被讨论,但他确实...我想说,在会计方面做了一些事情? Chandler
friends_ursula 下采样读取。Ursula 是双胞胎,但由同一女演员扮演! Ursula
friends_joey 洗牌或解洗牌配对末端读取。Joey 可以社交! Joey
friends_barry 将重叠的配对末端连接在一起。他们可能并不总是喜欢这样,但Barry可以成为朋友朋友之间的连接。 Barry
friends_gunther 验证您的读取...以及 Gunther
friends_quality_filter 将质量低的核苷酸转换为"N"。
friends_trimmer 对末端平齐的读取进行修剪。
friends_replace 使用正则表达式查找和替换。
friends_regex 使用正则表达式过滤读取。

依赖关系

~6MB
~113K SLoC