2个版本
使用旧Rust 2015
0.9.1 | 2018年8月19日 |
---|---|
0.9.0 | 2018年4月26日 |
在#sequencing中排名第28
12KB
132行(不包括注释)
illumina_coordinates
在Illumina测序过程中创建的FASTQ文件中,序列标识符包含产生序列的DNA簇的坐标(以及其他信息)。这个库解析这些标识符。
用法
extern crate illumina_coordinates;
fn main() {
let line = "@M03745:11:000000000-B54L5:1:2108:4127:8949";
let seq_id = illumina_coordinates::parse_sequence_identifier(&line).unwrap();
assert_eq!(seq_id.sequencer_id, "M03745".to_string());
assert_eq!(seq_id.run_count, 11);
assert_eq!(seq_id.flow_cell_id, "000000000-B54L5".to_string());
assert_eq!(seq_id.lane, 1);
assert_eq!(seq_id.side, 2);
assert_eq!(seq_id.swath, 1);
assert_eq!(seq_id.tile, 8);
assert_eq!(seq_id.x, 4127);
assert_eq!(seq_id.y, 8949);
}
字段描述
以下是一个示例序列标识符
@M03745:11:000000000-B54L5:1:2108:4127:8949
值 | 含义 |
---|---|
M03745 |
测序机的ID |
11 |
该机型的运行次数 |
000000000-B54L5 |
流式细胞的ID。在示例中,"B54L5"将打印在这个流式细胞上 |
1 |
通道号。对于MiSeqs,只有一个通道 |
2 来自2108 |
芯片的侧面 |
1 来自2108 |
条带(对于MiSeqs,这始终是1。对于HiSeqs,每个通道有两块板,从左到右的第一遍是条带一,然后是通道另一侧的返回遍是条带二 |
08 来自2108 |
板号。对于MiSeqs,这是一个从1到19的数字 |
4127 |
读取在板中的x位置,以任意单位表示 |
8949 |
读取在板中的y位置,以任意单位表示 |
有关更多信息,请参阅https://help.basespace.illumina.com/articles/descriptive/fastq-files/。