2 个版本
0.1.1 | 2024年6月9日 |
---|---|
0.1.0 | 2024年6月8日 |
#1 在 #gff
每月 64 次下载
36KB
595 行
tuni
tuni
的目标是统一不同样本中的转录本。
概述
转录本组装工具可以生成任意的转录本ID,这可能导致同一转录本在不同样本中被标注为不同的ID。
例如,给定两个样本 sample_1.gtf
和 sample_2.gtf
sample_1.gtf
chr1 test transcript 1 100 . + . transcript_id "A";
chr1 test exon 1 40 . + . transcript_id "A";
chr1 test exon 50 100 . + . transcript_id "A";
--snip--
sample_2.gtf
chr1 test transcript 1 100 . + . transcript_id "B";
chr1 test exon 1 40 . + . transcript_id "B";
chr1 test exon 50 100 . + . transcript_id "B";
--snip--
上面显示的转录本在这两个样本中是相同的,然而提供的 transcript_id
对于每个样本都是不同的,"A" 与 "B"。
tuni
为每个输入 .gtf
/.gff
生成一个 .tuni.gtf
/.tuni.gff
。这些输出文件将包含一个额外的属性字段 tuni_id
,其中包含一个统一的ID,该ID对于不同样本中的相同转录本是相同的。
sample_1.tuni.gtf
chr1 test transcript 1 100 . + . transcript_id "A"; tuni_id "tuni_0";
chr1 test exon 1 40 . + . transcript_id "A"; tuni_id "tuni_0";
chr1 test exon 50 100 . + . transcript_id "A"; tuni_id "tuni_0";
--snip--
sample_2.tuni.gtf
chr1 test transcript 1 100 . + . transcript_id "B"; tuni_id "tuni_0";
chr1 test exon 1 40 . + . transcript_id "B"; tuni_id "tuni_0";
chr1 test exon 50 100 . + . transcript_id "B"; tuni_id "tuni_0";
--snip--
安装
二进制文件
从 发布 下载适用于 Linux 或 macOS (ARM) 的最新二进制文件。
Cargo
安装 Rust 然后运行
cargo install tuni
用法
Usage: tuni [OPTIONS] --gtf-gff-path <*.txt> --output-dir </output/dir/>
Options:
-g, --gtf-gff-path <*.txt> A text file containing GTF/GFF paths
-o, --output-dir </output/dir/> Directory where outputted GTF/GFFs will be stored
-v, --verbose Print log messages
-h, --help Print help
-V, --version Print version
注意:目前,tuni
仅接受 版本 2 .gff
文件。
依赖关系
~1.4–2MB
~39K SLoC