#fastq #sequencing #bioinformatics #illumina #champ

illuminacoor_ordinates

解析在FASTQ文件中找到的Illumina序列标识符

2个版本

使用旧Rust 2015

0.9.1 2018年8月19日
0.9.0 2018年4月26日

#sequencing中排名第28

MIT许可证

12KB
132行(不包括注释)

illumina_coordinates

Build Status

在Illumina测序过程中创建的FASTQ文件中,序列标识符包含产生序列的DNA簇的坐标(以及其他信息)。这个库解析这些标识符。

用法

extern crate illumina_coordinates;

fn main() {
    let line = "@M03745:11:000000000-B54L5:1:2108:4127:8949";
    let seq_id = illumina_coordinates::parse_sequence_identifier(&line).unwrap();
    assert_eq!(seq_id.sequencer_id, "M03745".to_string());
    assert_eq!(seq_id.run_count, 11);
    assert_eq!(seq_id.flow_cell_id, "000000000-B54L5".to_string());
    assert_eq!(seq_id.lane, 1);
    assert_eq!(seq_id.side, 2);
    assert_eq!(seq_id.swath, 1);
    assert_eq!(seq_id.tile, 8);
    assert_eq!(seq_id.x, 4127);
    assert_eq!(seq_id.y, 8949);
}

字段描述

以下是一个示例序列标识符

@M03745:11:000000000-B54L5:1:2108:4127:8949

含义
M03745 测序机的ID
11 该机型的运行次数
000000000-B54L5 流式细胞的ID。在示例中,"B54L5"将打印在这个流式细胞上
1 通道号。对于MiSeqs,只有一个通道
2来自2108 芯片的侧面
1来自2108 条带(对于MiSeqs,这始终是1。对于HiSeqs,每个通道有两块板,从左到右的第一遍是条带一,然后是通道另一侧的返回遍是条带二
08来自2108 板号。对于MiSeqs,这是一个从1到19的数字
4127 读取在板中的x位置,以任意单位表示
8949 读取在板中的y位置,以任意单位表示

有关更多信息,请参阅https://help.basespace.illumina.com/articles/descriptive/fastq-files/

无运行时依赖项