#生物信息学 #fasta #fastq #文件格式 #压缩

fffx

另一种fasta/q/x文件格式解析器。经过充分的模糊测试。

4个版本

0.1.3 2023年7月8日
0.1.2 2023年1月10日
0.1.1 2022年10月12日
0.1.0 2022年10月7日

#300生物学

Download history 27/week @ 2024-03-08 13/week @ 2024-03-15 3/week @ 2024-03-22 29/week @ 2024-03-29 8/week @ 2024-04-05 3/week @ 2024-04-26 1/week @ 2024-05-03 7/week @ 2024-06-07 164/week @ 2024-06-14 4/week @ 2024-06-21

每月 175 次下载

MIT/Apache

29KB
624 代码行

又是另一个fasta/q/x解析器

虽然...经过充分的模糊测试

基准测试

我不知道这是否正确,但速度足够快。注意:此版本不包括I/O,因为I/O不在本库的范围内(目前如此),因此uniprot作为原始字符串包含在二进制文件中。

Running benches/parse_fasta.rs (target/release/deps/parse_fasta-1e449f5527386a9a) 
Parse UniProt SwissProt FASTA File/parse_fasta 
  time: [54.788 ns 54.922 ns 55.069 ns] 
  thrpt: [4773329 GiB/s 4786111 GiB/s 4797786 GiB/s] 

Found 11 outliers among 100 measurements (11.00%)
  4 (4.00%) low mild 4 (4.00%) high mild
  3 (3.00%) high severe

变更日志

0.1.3

将bytelines固定到2.2.2以删除tokio/futures依赖项,因为它在这里未使用。

0.1.2

将zlib-ng更改为flate2,仅使用zlib。


lib.rs:

另一个专注于速度和内存使用的Rust fasta/fastq解析器。经过充分的模糊测试和性能优化。

基本使用的子模块是fasta、fastq。

在zerocopy::下使用的那些稍微节省内存,但以不连续流为代价。

依赖项

~1.5MB
~27K SLoC