#parser #incremental #api-bindings

tree-sitter-c2rust

Rust 对 Tree-sitter 解析库的绑定,通过 c2rust 使用纯 Rust 运行时

6 个版本

0.22.6 2024 年 7 月 19 日
0.22.5 2024 年 4 月 19 日
0.20.11-pre.12024 年 4 月 13 日
0.20.10 2023 年 4 月 9 日
0.20.9 2023 年 2 月 1 日

208解析器实现

Download history 995/week @ 2024-05-03 1467/week @ 2024-05-10 1295/week @ 2024-05-17 1538/week @ 2024-05-24 2268/week @ 2024-05-31 1396/week @ 2024-06-07 2099/week @ 2024-06-14 2472/week @ 2024-06-21 1598/week @ 2024-06-28 1226/week @ 2024-07-05 1971/week @ 2024-07-12 1969/week @ 2024-07-19 1577/week @ 2024-07-26 1563/week @ 2024-08-02 2308/week @ 2024-08-09 2011/week @ 2024-08-16

7,672 每月下载量
8 个 crate 中使用 (5 个直接使用)

MIT 许可证

1.5MB
35K SLoC

Rust 24K SLoC // 0.0% comments C 11K SLoC // 0.1% comments

Rust Tree-sitter

crates.io badge

Rust 对 Tree-sitter 解析库的绑定。

基本用法

首先,创建一个解析器

use tree_sitter::{InputEdit, Language, Parser, Point};

let mut parser = Parser::new();

cc crate 添加到您的 Cargo.toml 中的 [build-dependencies]

[build-dependencies]
cc="*"

然后,添加一个语言作为依赖项

[dependencies]
tree-sitter = "0.22"
tree-sitter-rust = "0.21"

然后,将它们分配给解析器以使用语言。

parser.set_language(&tree_sitter_rust::language()).expect("Error loading Rust grammar");

现在您可以解析源代码

let source_code = "fn test() {}";
let mut tree = parser.parse(source_code, None).unwrap();
let root_node = tree.root_node();

assert_eq!(root_node.kind(), "source_file");
assert_eq!(root_node.start_position().column, 0);
assert_eq!(root_node.end_position().column, 12);

编辑

一旦您有了语法树,当您的源代码更改时,您可以更新它。传入先前的编辑树可以使 parse 运行得更快

let new_source_code = "fn test(a: u32) {}";

tree.edit(&InputEdit {
  start_byte: 8,
  old_end_byte: 8,
  new_end_byte: 14,
  start_position: Point::new(0, 8),
  old_end_position: Point::new(0, 8),
  new_end_position: Point::new(0, 14),
});

let new_tree = parser.parse(new_source_code, Some(&tree));

文本输入

要解析的源代码可以提供为字符串、切片、向量或作为返回切片的函数。文本可以编码为 UTF8 或 UTF16

// Store some source code in an array of lines.
let lines = &[
    "pub fn foo() {",
    "  1",
    "}",
];

// Parse the source code using a custom callback. The callback is called
// with both a byte offset and a row/column offset.
let tree = parser.parse_with(&mut |_byte: usize, position: Point| -> &[u8] {
    let row = position.row as usize;
    let column = position.column as usize;
    if row < lines.len() {
        if column < lines[row].as_bytes().len() {
            &lines[row].as_bytes()[column..]
        } else {
            b"\n"
        }
    } else {
        &[]
    }
}, None).unwrap();

assert_eq!(
  tree.root_node().to_sexp(),
  "(source_file (function_item (visibility_modifier) (identifier) (parameters) (block (number_literal))))"
);

依赖项

~3–16MB
~227K SLoC