2 个不稳定版本

0.2.0 2024年6月24日
0.1.0 2022年11月10日

#62 in 生物学

Download history 129/week @ 2024-06-23 49/week @ 2024-06-30

每月 73 次下载

MIT 许可证

20KB
93 代码行

seqdupes

从FASTA文件中移除重复项。支持根据序列内容或标题信息进行过滤。

安装

源代码

下载源代码并运行

cargo install

用法

运行seqdupes来处理FASTA文件。您可以指定是否根据序列或标题进行过滤。

根据序列过滤(默认)

seqdupes -f path/to/sequence.fastq -j path/to/output.json > no_dupes.fas

根据标题过滤

如果您希望根据标题而不是序列来过滤重复项,请使用--by-header标志。

seqdupes -f path/to/sequence.fastq -j path/to/output.json --by-header > no_dupes.fas

参数

参数 默认 描述
-f, --fasta - 要使用的FASTQ文件的路径。
-j, --json - 列出重复项的输出路径。
-b, --by-header - 启用基于标题的过滤(可选)。

工具将输出一个没有重复项的FASTA文件到stdout,并将包含重复项详细信息的JSON文件输出到指定的路径。

依赖项

~23–37MB
~606K SLoC