4个版本
0.1.3 | 2023年8月7日 |
---|---|
0.1.2 | 2023年8月2日 |
0.1.1 | 2023年8月1日 |
0.1.0 | 2023年7月31日 |
#1219 in 解析器实现
125KB
2K SLoC
pagegraph
此crate提供用于分析PageGraph输出的实用程序。
工作空间组织
pagegraph
提供用于直接与pagegraph文件交互和构建自定义提取工具的核心库。
pagegraph-cli
提供对常见操作的更便捷、无代码的包装,以易于解析的格式提供输出。
示例
以下示例从PageGraph文件中读取并生成对应网页中所有已删除的div
元素。
use pagegraph::from_xml::read_from_file;
use pagegraph::types::{ NodeType, EdgeType };
fn main() {
let graph = read_from_file("/path/to/any/pagegraph.graphml");
let deleted_divs = graph.filter_nodes(|node| {
match node {
NodeType::HtmlElement { is_deleted: true, tag_name, .. } if tag_name == "div" => true,
_ => false,
}
});
}
依赖关系
~13MB
~303K SLoC