#bed #convert #format #multiple #maf #tabix #jbrowse-plugin-mafviewer

app maf2bed

将多个比对格式(MAF)文件转换为bed格式,用于tabix。与jbrowse-plugin-mafviewer插件一起使用。

3个版本 (破坏性更新)

0.3.0 2023年12月21日
0.2.0 2023年11月2日
0.1.0 2023年11月2日

#103 in 生物学

每月下载 50次

MIT 协议

5KB
67

maf2bed

用于将多个比对格式(MAF)文件转换为bed tabix-y风格格式。用于jbrowse mafviewer插件 https://github.com/cmdcolin/jbrowse-plugin-mafviewer

安装

cargo install maf2bed
maf2bed --help

用法

请确保将用作bed文件参考的'组装名称'指定为maf2bed的第一个参数。

#non parallel compression/decompression
zcat file.maf.gz | maf2bed assembly_name | bgzip > file.bed.gz
#parallel compression/decompression
pigz -dc file.maf.gz | maf2bed assembly_name | bgzip -@8 > file.bed.gz

tabix file.bed.gz

在某些情况下,可能需要在bgzip/tabix之前对bed文件进行sort -k1,1 -k2,2n排序。

脚注

主要作为编程练习从perl转换为rust,速度有所提高 https://twitter.com/cmdcolin/status/1719608993310486883

动机

我想尝试使用bigMaf(基于bigBed的)格式生态系统与大型MAF文件一起使用,但bedToBigBed不支持流式传输或读取压缩文件(?),因此需要读取磁盘和内存中的大文件。相比之下,这里实现的类似MAF tabix类型的方法可以进行压缩和流式传输,从而允许使用更低的内存使用量和磁盘空间。

无运行时依赖项