#bed #blocks #split #genomics #distance #file #length

bin+lib bedblocks

将 BED 文件分割成块

1 个不稳定版本

0.1.0 2024年4月17日

#192生物学

MIT 许可证

435KB
169

包含 (Mach-o 可执行文件, 1MB) bedblocks

bedblocks

从 BED 文件创建基因组块的工具

⚠️ 这是处于 alpha 测试阶段的实验性软件。

在基因组学中,常见(几乎)的问题是需要将基因组分割成块,最好是块之间有一定的距离。Bedblocks 允许用户将 BED 文件高效地分割成给定长度且相隔一定距离的块。

安装

在适当的时候,bedblocks 将通过适当的渠道提供。目前,在这个 Git 仓库中提供了在 MacOS 上制作的二进制文件。

使用方法

给定一个 BED 文件,例如

chr2	0	5000
chr3	4	4000
chr4	10	255
chr5	1	899

我们可以运行

bedblocks --input example.bed --blocklength 100 --min-dist 1000

这将得到以下结果

chr2    0       99
chr2    1100    1199
chr2    2200    2299
chr2    3300    3399
chr3    4       103
chr3    1104    1203
chr3    2204    2303

速度

在 Apple M2 芯片上,bedblocks 在大约 7.5 秒内将包含 1740 万条条目的 BED 文件分割成长度为 100 且最小间隔为 100 nt 的块。

依赖项

~18MB
~317K SLoC