#gtf-gff #gtf #gff #transcript-assembly

app tuni

统一不同样本中的转录本

2 个版本

0.1.1 2024年6月9日
0.1.0 2024年6月8日

#1#gff

Download history 353/week @ 2024-06-06 25/week @ 2024-06-13

每月 64 次下载

MIT 许可协议

36KB
595

tuni

crates ci

tuni 的目标是统一不同样本中的转录本。

概述

转录本组装工具可以生成任意的转录本ID,这可能导致同一转录本在不同样本中被标注为不同的ID。

例如,给定两个样本 sample_1.gtfsample_2.gtf

sample_1.gtf

chr1 test transcript 1 100 . + . transcript_id "A"; 
chr1 test exon 1 40 . + . transcript_id "A"; 
chr1 test exon 50 100 . + . transcript_id "A";
--snip-- 

sample_2.gtf

chr1 test transcript 1 100 . + . transcript_id "B"; 
chr1 test exon 1 40 . + . transcript_id "B"; 
chr1 test exon 50 100 . + . transcript_id "B";
--snip-- 

上面显示的转录本在这两个样本中是相同的,然而提供的 transcript_id 对于每个样本都是不同的,"A" 与 "B"。

tuni 为每个输入 .gtf/.gff 生成一个 .tuni.gtf/.tuni.gff。这些输出文件将包含一个额外的属性字段 tuni_id,其中包含一个统一的ID,该ID对于不同样本中的相同转录本是相同的。

sample_1.tuni.gtf

chr1 test transcript 1 100 . + . transcript_id "A"; tuni_id "tuni_0";
chr1 test exon 1 40 . + . transcript_id "A"; tuni_id "tuni_0";
chr1 test exon 50 100 . + . transcript_id "A"; tuni_id "tuni_0";
--snip-- 

sample_2.tuni.gtf

chr1 test transcript 1 100 . + . transcript_id "B"; tuni_id "tuni_0";
chr1 test exon 1 40 . + . transcript_id "B"; tuni_id "tuni_0";
chr1 test exon 50 100 . + . transcript_id "B"; tuni_id "tuni_0";
--snip-- 

安装

二进制文件

发布 下载适用于 Linux 或 macOS (ARM) 的最新二进制文件。

Cargo

安装 Rust 然后运行

cargo install tuni

用法

Usage: tuni [OPTIONS] --gtf-gff-path <*.txt> --output-dir </output/dir/>

Options:
  -g, --gtf-gff-path <*.txt>       A text file containing GTF/GFF paths
  -o, --output-dir </output/dir/>  Directory where outputted GTF/GFFs will be stored
  -v, --verbose                    Print log messages
  -h, --help                       Print help
  -V, --version                    Print version

注意:目前,tuni 仅接受 版本 2 .gff 文件。

依赖关系

~1.4–2MB
~39K SLoC