#压缩 #解析器 #gz #fastq #文件 #读取 #哈希

fastxgz

支持压缩和非压缩文件格式的fasta/fastq解析器

3个版本 (破坏性更新)

0.3.0 2023年11月14日
0.2.0 2023年9月26日
0.1.0 2023年9月18日

#200 in 生物学

AGPL-3.0

17KB
398

fastxgz

rust的fastx解析器。支持Gz和非Gz文件。

描述

该解析器可以遍历fasta/fastq文件中的读取内容,可能被压缩(gz)。压缩文件应以".gz"结尾。该解析器还可以遍历每个读取的k-mer,甚至这些k-mer的哈希值。

有关详细信息和使用示例,请参阅rust文档

该解析器旨在便于使用。尽管速度不是最快,但它在笔记本电脑SSD上枚举fastq文件行数时的速度仅比wc -l慢28%。

如何使用此工具

只需将以下内容添加到您的Cargo.toml文件中

[dependencies]
fastxgz = "{X}.{Y}.{Z}"  # Please check and use the newest version

然后

use fastxgz::fasta_reads;

let reads = fasta_reads("data/tests/test.fa").expect("The file cannot be opened.");
for read in reads {
    println!("{}", read);
}

依赖项

~410KB