#lexer #input #generic #match #closures #enums #buffered-input

generic-lexer

使用简单匹配函数的泛型词法分析器

4 个版本

0.5.0 2020 年 3 月 30 日
0.4.2 2020 年 3 月 30 日
0.3.0 2020 年 3 月 26 日
0.2.0 2020 年 3 月 26 日
0.1.3 2020 年 3 月 26 日

#2572Rust 模式

MIT/Apache

11KB
148

generic-lexer

Crates.io Crates.io

使用简单匹配函数或闭包实现的 Rust 泛型词法分析器

use generic_lexer::{Lexer, BufferedInput, MatchError};

#[derive(Debug)]
enum TokenKind {
    Int, Float,
    Name,
    Plus, Minus, Star, Slash, Semicolon, Equals,
}

fn lex_int(input: &mut BufferedInput) -> TokenKind {
    input.accept_while(char::is_ascii_digit);
    if let Some(_) = input.accept_if(|c| *c == '.') {
        return lex_float(input);
    }
    TokenKind::Int
}

fn lex_float(input: &mut BufferedInput) -> TokenKind {
    input.accept_while(char::is_ascii_digit);
    TokenKind::Float
}

fn lex_name(input: &mut BufferedInput) -> TokenKind {
    input.accept_while(|c| *c == '_' || c.is_ascii_alphabetic());
    TokenKind::Name
}

fn lex(first_char: char, input: &mut BufferedInput) -> Result<TokenKind, MatchError> {
    let kind = match first_char {
        '+' => TokenKind::Plus,
        '-' => TokenKind::Minus,
        '*' => TokenKind::Star,
        '/' => TokenKind::Slash,
        ';' => TokenKind::Semicolon,
        '=' => TokenKind::Equals,

        c if c.is_ascii_digit() => lex_int(input),
        c if c.is_ascii_alphabetic() => lex_name(input),

        c => return Err(MatchError::Unexpected(c))
    };

    Ok(kind)
}

fn main() -> Result<(), Box<dyn std::error::Error>> {
    let input = "a = 420 + 69 * 3.14;";
    let lexer = Lexer::new(&input, &lex, true);
    let tokens = lexer.collect::<Result<Vec<_>, _>>()?;
    println!("{:#?}", tokens);
    Ok(())
}
[
    Token {
        kind: Name,
        text: "a",
    },
    Token {
        kind: Equals,
        text: "=",
    },
    Token {
        kind: Int,
        text: "420",
    },
    Token {
        kind: Plus,
        text: "+",
    },
    Token {
        kind: Int,
        text: "69",
    },
    Token {
        kind: Star,
        text: "*",
    },
    Token {
        kind: Float,
        text: "3.14",
    },
    Token {
        kind: Semicolon,
        text: ";",
    },
]

无运行时依赖