2 个不稳定版本
0.2.0 | 2024年6月24日 |
---|---|
0.1.0 | 2022年11月10日 |
#62 in 生物学
每月 73 次下载
20KB
93 代码行
seqdupes
从FASTA文件中移除重复项。支持根据序列内容或标题信息进行过滤。
安装
源代码
下载源代码并运行
cargo install
用法
运行seqdupes
来处理FASTA文件。您可以指定是否根据序列或标题进行过滤。
根据序列过滤(默认)
seqdupes -f path/to/sequence.fastq -j path/to/output.json > no_dupes.fas
根据标题过滤
如果您希望根据标题而不是序列来过滤重复项,请使用--by-header
标志。
seqdupes -f path/to/sequence.fastq -j path/to/output.json --by-header > no_dupes.fas
参数
参数 | 默认 | 描述 |
---|---|---|
-f, --fasta | - | 要使用的FASTQ文件的路径。 |
-j, --json | - | 列出重复项的输出路径。 |
-b, --by-header | - | 启用基于标题的过滤(可选)。 |
工具将输出一个没有重复项的FASTA文件到stdout
,并将包含重复项详细信息的JSON文件输出到指定的路径。
依赖项
~23–37MB
~606K SLoC