#gff3 #bioinformatics #fasta

程序 stats_on_gff3

计算CDS GC3比率、内含子GC比率、侧翼基因区域GC比率、第一个内含子长度、内含子数量、CpG比率等统计数据。示例:stats_on_gff3 Homo_sapiens.GRCh38.109.chromosome.1.gff3 Homo_sapiens.GRCh38.dna.chromosome.1.fa zcat Ciona_savignyi.CSAV2.0.dna.toplevel.fa.gz | stats_on_gff3 Ciona_savignyi.CSAV2.0.109.gff3 stdin 查看 https://gitlab.in2p3.fr/penel/stats_on_gff3

26个版本

0.1.26 2024年2月22日
0.1.25 2024年2月22日
0.1.18 2023年8月1日
0.1.17 2023年7月28日
0.1.4 2023年4月28日

#64 in 生物学

Download history 60/week @ 2024-07-02 98/week @ 2024-07-23 45/week @ 2024-07-30

每月143次下载

CECILL-2.1

61KB
1K SLoC

gff3文件统计数据

安装

cargo安装 stats_on_gff3

Crates: https://crates.io/crates/stats_on_gff3

示例

stats_on_gff3--精确度1000.GRCh38.109.染色体.1.gff3 人.GRCh38.dna.染色体.1.fa2>错误

stats_on_gff3--所有 人.GRCh38.109.染色体.1.gff3 人.GRCh38.dna.染色体.1.fa2>错误

zcat Ciona_savignyi.CSAV2.0.dna.顶层.fa.gz|stats_on_gff3--精确度100Ciona_savignyi.CSAV2.0.109.gff3 stdin2>错误

输入数据

来自Ensembl的Gff文件及其关联的fasta文件。Fasta序列应为大写。(对于NCBI数据,请参阅stats_on_gff3_ncbi https://crates.io/crates/stats_on_gff3_ncbi

依赖关系

~18MB
~318K SLoC