15个不稳定版本 (5个破坏性版本)

0.9.0 2024年7月12日
0.8.2 2024年3月8日
0.8.0 2024年2月26日
0.6.0 2023年6月29日
0.4.1 2021年7月22日

#260 in 生物学

Download history 1/week @ 2024-04-21 14/week @ 2024-05-19 14/week @ 2024-05-26 30/week @ 2024-06-02 18/week @ 2024-06-09 29/week @ 2024-06-16 21/week @ 2024-06-23 22/week @ 2024-06-30 109/week @ 2024-07-07 35/week @ 2024-07-14 25/week @ 2024-07-21 24/week @ 2024-07-28 2/week @ 2024-08-04

每月105次下载
用于4 crate

自定义许可

205KB
3.5K SLoC

libradicl

Libradicl是一个Rust库,用于读取(最终可能还会写入和操作)简化对齐数据(RAD)格式文件。这些文件由salmon在准备使用alevin-fry进行单细胞量化时的数据进行生成。

目前,libradicl主要是在支持alevin-fry的情况下开发的,所以它还没有作为一个通用的库完全开发。最终,我们预计API将进行重组和稳定。


lib.rs:

libradicl是一个用于读取(和写入)RAD(简化对齐数据)格式文件的crate。RAD格式是一种二进制格式,用于编码关于测序读数和它们如何映射到一组目标(基因组、宏基因组、转录组等)的对齐信息。该格式被称为“简化”,因为它允许包含比例如SAM格式文件更稀疏的信息。

虽然这个crate的最终目标是为读取和写入可能用于任何目的的RAD文件提供通用的API,但它主要是由我们(COMBINE-lab)在创建使用RAD格式的工具(例如alevin-frypiscem-infer)中的需求驱动的。因此,功能通常按照对这些工具开发最紧迫的顺序开发和添加。然而,我们欢迎通过pull请求的外部贡献,并乐意讨论您对RAD格式的潜在用途,以及它们如何得到支持。

此crate被分解为多个组件,覆盖了RAD文件的各个部分,包括类型标签系统、头部和主要数据块。每个模块的名称相对容易理解。

依赖项

~9–16MB
~202K SLoC