#gtf-gff #gtf #gff #convert #cli #chrom

bin+lib gxf2chrom

从 GTF/GFF 文件中的 .chrom 获取所有内容

1 个不稳定版本

0.1.0 2024 年 3 月 4 日

#666科学

MIT 许可证

25KB
536

Crates.io GitHub Crates.io Total Downloads Conda Platform

gxf2chrom

从 GTF/GFF 文件中的 .chrom 获取所有内容。

将 GTF/GFF 文件转换为

ENSP00000501388.1       chr1    -       19417068        19485438
ENSP00000438792.1       chr11   -       72754899        72781181
ENSP00000224756.8       chr10   +       84371052        84513540
ENSP00000415935.1       chr2    +       215312481       215349652

不同物种的一些统计数据

  • Homo sapiens GRCh38 GENCODE 44(252,835 个转录本)在 1.84 秒内。
  • Mus musculus GRCm39 GENCODE 44(149,547 个转录本)在 1.02 秒内。
  • Canis lupus familiaris ROS_Cfam_1.0 Ensembl 110(55,335 个转录本)在 0.57 秒内。
  • Gallus galus bGalGal1 Ensembl 110(72,689 个转录本)在 0.62 秒内。

用法

Usage: gxf2chrom [OPTIONS] --input <GXF> --output <CHROM>
 
Arguments:
    --input/-i <GXF>: a .gtf/gff/*.gz file
    --output/-o <CHROM>: path to output .chrom file

Options:
    --help/-h: print help
    --version/-v: print version
    --feature/-f: feature to extract [default: protein_id]
    --threads/-t: number of threads [default: max ncpus]

安装

要在您的系统上安装 gxf2chrom,请按照以下步骤操作

  1. 获取 rust: 在 Unix 上运行 curl https://sh.rustup.rs -sSf | sh,或前往 此处 了解其他选项
  2. 运行 cargo install gxf2chrom(确保在运行之前 ~/.cargo/bin 在您的 $PATH 中)
  3. 使用 gxf2chrom 与所需的参数
  4. 享受吧!

构建

要从此仓库构建 gxf2chrom,请执行以下操作

  1. 获取 rust(如上所述)
  2. 运行 git clone https://github.com/alejandrogzi/gxf2chrom.git && cd gxf2chrom
  3. 运行 cargo run --release -- -i <GXF> -o <CHROM> [OPTIONS]

容器镜像

构建开发容器镜像

  1. 运行 git clone https://github.com/alejandrogzi/gxf2chrom.git && cd gxf2chrom
  2. 使用以下命令初始化Docker:start dockersystemctl start docker
  3. 构建镜像:docker image build --tag gxf2chrom .
  4. 运行:docker run --rm -v "[dir_where_your_gxf_is]:/dir" gxf2chrom -i /dir/<GXF> -o /dir/<CHROM>

Conda

要使用Conda通过gxf2chrom,只需

  1. conda install gxf2chrom -c biocondaconda create -n gxf2chrom -c bioconda gtfsort

基准测试

此工具受NCBIgff2chrom.py的启发,该文件位于Oxford dot plots存储库中,可以快速将GTF/GFF文件转换为.chrom文件。以下是快速基准测试结果:

格式 odp gxf2chrom
gff3 4.30 +/- 0.03 1.88 +/- 0.01 x2.29
gff3.gz 6.27 +/- 0.18 2.05 +/- 0.01 x3.06
gtf --- 1.83 +/- 0.01 ---
gtf.gz --- 1.94 +/- 0.01 ---

具有更快的速度,gxf2chrom旨在成为任何管道中实现的多功能方法!

依赖项

~4–16MB
~151K SLoC