#bus #single-cell #rna-seq #command-line-interface #kallisto #scrnaseq

bin+lib bustools_cli

Rust 重新实现 bustools 用于单细胞 RNA 测序处理

10 个不稳定版本 (4 个破坏性更改)

新功能 0.5.1 2024 年 8 月 19 日
0.4.0 2024 年 7 月 1 日
0.3.0 2024 年 2 月 6 日
0.2.1 2023 年 9 月 15 日
0.1.0 2023 年 6 月 27 日

#119 in 生物学

Download history 355/week @ 2024-06-24 236/week @ 2024-07-01

每月 633 次下载

GPL-3.0-or-later

105KB
2K SLoC

README

Rust 版本的 bustools 命令行界面。目前,它还远未完善和正确,而是一个学习 Rust 的项目。

该项目大量基于 rustbustools 构建,它处理与 bus 文件的所有基本交互。

示例

# sorting
rustbustools --output /tmp/sorted.bus sort --ifile /tmp/unsorted.bus

# correcting CBs
rustbustools --output /tmp/corrected.bus sort --ifile /tmp/sorted.bus --whitelist /tmp/10x_whitelist.txt

# inspecting
rustbustools --output /dev/null --ifile /tmp/sorted.bus

# count
rustbustools --output /tmp/count_folder --ifile /tmp/sorted.bus --t2g /tmp/transcripts_to_gene.txt

# compression
# -N is the chunksize of a busz block
rustbustools --output /tmp/compressed.busz -i /tmp/sorted.bus -N 10000

# decompression
rustbustools --output /tmp/plain.bus -i /tmp/compressed.busz

待办事项 08/05

  • 性能检查
    • 排序:似乎比较慢
    • 修正:由于 BKTree 导致一些性能问题
    • 计数:比原始 bustools 稍慢,但基本在同一水平
    • 检查:已经很快了
    • 蝴蝶扩增:已经很快了
  • 处理压缩的 bus 文件
  • 使 CLI 参数与原始 bustools 兼容/一致

依赖项

~15–25MB
~413K SLoC