#gtf #noodles #format #bioinformatics #gene #transfer #reader-writer

noodles-gtf

基因转移格式(GTF)读取器和写入器

29次重大版本发布

0.30.0 2024年7月14日
0.28.0 2024年5月16日
0.25.0 2024年3月28日
0.22.0 2023年12月14日
0.1.0 2021年11月11日

生物学 中排名 153

Download history 395/week @ 2024-05-01 189/week @ 2024-05-08 427/week @ 2024-05-15 497/week @ 2024-05-22 223/week @ 2024-05-29 184/week @ 2024-06-05 411/week @ 2024-06-12 347/week @ 2024-06-19 163/week @ 2024-06-26 97/week @ 2024-07-03 403/week @ 2024-07-10 175/week @ 2024-07-17 182/week @ 2024-07-24 241/week @ 2024-07-31 154/week @ 2024-08-07 173/week @ 2024-08-14

每月下载量 770
12 个crate(2个直接使用) 中使用

MIT 协议

355KB
8K SLoC

noodles

crates.io Docs.rs CI status

noodles 尝试提供符合规范(当适用时)的库的实现,用于处理各种生物信息学文件格式。它目前支持 BAM 1.6、BCF 2.2、BED、BGZF、CRAM 3.0/3.1、CSI、FASTA、FASTQ、GFF3、GTF 2.2、htsget 1.3、refget 2.0、SAM 1.6、tabix、和 VCF 4.3/4.4。

使用方法

noodles 发布在 crates.io 上。早期版本可以用于项目,但请注意,API 仍被视为实验性的。

noodles 被分成多个crate,按文件格式划分。为了方便,可以将顶级元crate noodles 添加到项目依赖列表中;格式,作为 功能 列出。例如,要处理 BAM 格式,添加 noodles crate 并启用 bam 功能。

cargo add noodles --features bam

然后可以通过其重新导出的名称导入已启用的功能,例如

use noodles::bam;

功能标志

各个crate可能具有可选功能,可以使用功能标志启用。

  • async:启用与 Tokio 的异步 I/O。(BAM、BCF、BGZF、CRAM、CSI、FASTA、FASTQ、GFF、SAM、tabix 和 VCF)
  • libdeflate:使用 libdeflate 对 DEFLATE 流进行编码和解码。(BGZF 和 CRAM)

示例

每个crate可能都有自己的示例目录,所有示例都可以作为应用程序运行。克隆仓库后,运行以下命令来获取可用的示例列表:cargo run --release --example。使用示例名称作为选项参数,并将程序参数附加到命令中,例如:

cargo run --release --example bam_write > sample.bam
cargo run --release --example bam_read_header sample.bam

lib.rs:

noodles-gtf 处理基因转移格式(GTF)的读取和写入。

依赖关系

~2.2–3MB
~48K SLoC