25 个稳定版本

2.7.11	2024 年 7 月 2 日
2.7.9	~~2024 年 4 月 2 日~~
2.7.8	2024 年 3 月 2 日
2.7.5	2023 年 10 月 24 日
2.0.0	2018 年 9 月 30 日

在解析工具中排名第 84

每月下载量 21,048
用于 9 个 crate（直接使用 8 个）

MIT/Apache

1.5MB
27K SLoC

pest. 优雅的解析器

pest 是一个用 Rust 编写的通用解析器，注重易用性、正确性和性能。它使用解析表达式语法（或 PEG）作为输入，这与正则表达式类似，但提供了更丰富的表达能力，以便解析复杂语言。

入门指南

开始使用 pest 进行解析的最佳方式是阅读官方的指南。

其他有用资源

在 docs.rs 上的 API 参考
在我们的 fiddle 上尝试语法并与他人分享
在 GitHub 讨论中找到或提问
在 Gitter 或 Discord 上留下反馈、提问或打招呼

示例

以下是一个语法示例，用于解析一个由不以数字开头的字母数字标识符组成的列表

alpha = { 'a'..'z' | 'A'..'Z' }
digit = { '0'..'9' }

ident = { !digit ~ (alpha | digit)+ }

ident_list = _{ ident ~ (" " ~ ident)* }
          // ^
          // ident_list rule is silent which means it produces no tokens

语法保存在单独的 .pest 文件中，这些文件永远不会与过程代码混合。这导致语言的形式化始终保持最新，易于阅读和维护。

有意义的错误报告

基于语法定义，解析器还包括自动错误报告。对于上面的示例，输入 "123" 将导致

thread 'main' panicked at ' --> 1:1
  |
1 | 123
  | ^---
  |
  = unexpected digit', src/main.rs:12

而 "ab *" 将导致

thread 'main' panicked at ' --> 1:1
  |
1 | ab *
  |    ^---
  |
  = expected ident', src/main.rs:12

这些错误信息可以从它们的默认Display实现中获取，例如：panic!("{}", parser_result.unwrap_err())或println!("{}", e)。

对API

可以使用该语法自动生成Parser实现。解析返回一个嵌套标记对的迭代器

use pest_derive::Parser;
use pest::Parser;

#[derive(Parser)]
#[grammar = "ident.pest"]
struct IdentParser;

fn main() {
    let pairs = IdentParser::parse(Rule::ident_list, "a1 b2").unwrap_or_else(|e| panic!("{}", e));

    // Because ident_list is silent, the iterator will contain idents
    for pair in pairs {
        // A pair is a combination of the rule which matched and a span of input
        println!("Rule:    {:?}", pair.as_rule());
        println!("Span:    {:?}", pair.as_span());
        println!("Text:    {}", pair.as_str());

        // A pair can be converted to an iterator of the tokens which make it up:
        for inner_pair in pair.into_inner() {
            match inner_pair.as_rule() {
                Rule::alpha => println!("Letter:  {}", inner_pair.as_str()),
                Rule::digit => println!("Digit:   {}", inner_pair.as_str()),
                _ => unreachable!()
            };
        }
    }
}

这会产生以下输出

Rule:    ident
Span:    Span { start: 0, end: 2 }
Text:    a1
Letter:  a
Digit:   1
Rule:    ident
Span:    Span { start: 3, end: 5 }
Text:    b2
Letter:  b
Digit:   2

在单个文件中定义多个解析器

当前的自动Parser推导将生成Rule枚举，如果尝试定义多个自动推导Parser的结构体，则会出现名称冲突。一种可能的解决方法是，将每个解析器结构体放入单独的命名空间

mod a {
    #[derive(Parser)]
    #[grammar = "a.pest"]
    pub struct ParserA;
}
mod b {
    #[derive(Parser)]
    #[grammar = "b.pest"]
    pub struct ParserB;
}

其他功能

优先级提升
输入处理
自定义错误
在稳定的Rust上运行

使用pest的项目

您可以在awesome-pest仓库中找到更多项目和生态系统工具。

最低支持的Rust版本（MSRV）

此库应始终在Rust 1.61.0上使用默认功能编译。

无标准库支持

pest和pest_derivecrate可以不使用Rust标准库构建，并针对嵌入式环境进行目标编译。为此，您需要禁用其默认功能。在您的Cargo.toml中，您可以指定如下：

[dependencies]
# ...
pest = { version = "2", default-features = false }
pest_derive = { version = "2", default-features = false }

如果您想在pest仓库的工作区中构建这些crate，您可以将--no-default-features标志传递给cargo，并使用--package（-p）标志指定这些crate。例如：

$ cargo build --target thumbv7em-none-eabihf --no-default-features -p pest
$ cargo bootstrap
$ cargo build --target thumbv7em-none-eabihf --no-default-features -p pest_derive

特别感谢

特别感谢Marius Minea教授的指导和所有pest贡献者，其中一些是我的朋友。

依赖关系

~270–485KB
~12K SLoC