4 个版本

0.1.3 2022 年 8 月 5 日
0.1.2 2022 年 6 月 30 日
0.1.1 2022 年 6 月 29 日
0.1.0 2022 年 6 月 29 日

399科学

MIT 许可证

250KB
555

samcomp

使用 Rust 编写的序列比对/映射文件比较工具。

安装

从源代码

如果您想从源代码构建 samcomp,您需要 Rust。然后可以使用 cargo 来构建所有内容

cargo install samcomp

使用方法

Usage: samcomp [options] <target.sam> <test.sam>

Options:
    -h, --help          print this help menu
    -o NAME             generate gain, loss and diff files with the name of
                        the reads and output them with the prefix NAME
    -d FLOAT            a location in the tested file is considered to be
                        similar to the one in the target file if the distance
                        between both locations is less than FLOAT fraction of
                        the read length [1.0]
    -q UINT1,UINT2,...  output the results using UINT1,UINT2,... (such as
                        UINT1 > UINT2 > ...) as the quality thresholds
                        [60,10,1,0]
    -m STR              Comparison mode [all]
                        - all: compare the primary and the secondary
                        alignments of the tested file with the primary and the
                        secondary alignments of the target file respectively
                        - prim_tgt: compare the primary, the secondary and the
                        supplementary alignments of the tested file with the
                        primary aligments of the target file
                        - prim: compare the primary alignments of the tested
                        file with the primary aligments of the target file
                        - prim_supp: compare the primary and the supplementary
                        alignments of the tested file with the primary
                        aligments of the target file

samcomp 评估包含相同 reads 的 2 个 SAM 文件(目标文件和测试文件)之间的差异。

以下是输出示例

M	60	6	3
M	30	7	3
M	20	7	3
M	10	7	3
M	5	7	3
M	2	7	9
M	1	8	9
M	0	8	9

G	60	0
G	30	0
G	20	0
G	10	0
G	5	0
G	2	1
G	1	1
G	0	1

L	60	0
L	30	0
L	20	0
L	10	0
L	5	0
L	2	0
L	1	0
L	0	0

D	60	1
D	30	1
D	20	1
D	10	1
D	5	1
D	2	1
D	1	2
D	0	2

每个 M 行(已映射)给出了目标文件(第 2 列)和测试文件(第 3 列)中映射质量等于或大于阈值的已映射 reads 的数量(第 1 列)。

每个 G 行(增益)给出了测试文件中已映射但目标文件中未映射的 reads 的数量(第 2 列),其映射质量等于或大于阈值(第 1 列)。

每个 L 行(损失)给出了测试文件中未映射但目标文件中已映射的 reads 的数量(第 2 列),其映射质量等于或大于阈值(第 1 列)。

每个 D 行(差异)给出了目标文件和测试文件中映射位置不同的 reads 的数量(第 2 列),其目标映射质量等于或大于阈值(第 1 列)。


使用选项 -o,还可以输出属于 G、L 和 D 类别的 reads 的名称(每行一个)。

依赖项

~445KB