3个版本 (破坏性更新)
0.3.0 | 2023年12月21日 |
---|---|
0.2.0 | 2023年11月2日 |
0.1.0 | 2023年11月2日 |
#103 in 生物学
每月下载 50次
5KB
67 行
maf2bed
用于将多个比对格式(MAF)文件转换为bed tabix-y风格格式。用于jbrowse mafviewer插件 https://github.com/cmdcolin/jbrowse-plugin-mafviewer
安装
cargo install maf2bed
maf2bed --help
用法
请确保将用作bed文件参考的'组装名称'指定为maf2bed的第一个参数。
#non parallel compression/decompression
zcat file.maf.gz | maf2bed assembly_name | bgzip > file.bed.gz
#parallel compression/decompression
pigz -dc file.maf.gz | maf2bed assembly_name | bgzip -@8 > file.bed.gz
tabix file.bed.gz
在某些情况下,可能需要在bgzip/tabix之前对bed文件进行sort -k1,1 -k2,2n排序。
脚注
主要作为编程练习从perl转换为rust,速度有所提高 https://twitter.com/cmdcolin/status/1719608993310486883
动机
我想尝试使用bigMaf(基于bigBed的)格式生态系统与大型MAF文件一起使用,但bedToBigBed不支持流式传输或读取压缩文件(?),因此需要读取磁盘和内存中的大文件。相比之下,这里实现的类似MAF tabix类型的方法可以进行压缩和流式传输,从而允许使用更低的内存使用量和磁盘空间。