#html-parser #parser #html #reader #web

html-parser-rs

一个用于解析HTML文档的Rust库。它支持以事件驱动的方式读取HTML文档。

1 个不稳定版本

0.1.0 2024年1月4日

#76#html-parser

MIT 许可证

10KB
151

Html Parser Rs

Rust License

html-parser-rs 是一个用于解析HTML文档的Rust库。它支持以事件驱动的方式读取HTML文档。这允许你在解析过程中接收不同元素、属性和文本内容的事件。

特性

  • 事件驱动解析:在解析过程中接收不同元素、属性和文本内容的事件。

用法

将此库添加到您的 Cargo.toml 文件

[dependencies]
html-parser-rs = "0.1.0"
use html_parser_rs::Lexer;
use std::fs;

fn main() {
    let contents = fs::read_to_string("./examples/index.html")
        .expect("Failed to read file.");

    let mut lexer = Lexer::new(contents);

    for token in lexer.parse() {
        println!("{token:?}");
    }
}

事件

  • StartElement(TAG_NAME):当HTML元素开始时触发。

  • EndElement(TAG_NAME):当HTML元素结束时触发。

  • TextContent(TEXT):当遇到文本内容时触发。

  • Attribute(NAME, VALUE):当遇到属性时触发。

贡献

欢迎贡献!我希望你在这个项目中做出贡献。

路线图

该项目处于早期阶段,还有很多需要实现的功能。查看 问题 部分以获取功能、增强和错误修复的列表。

许可证

该项目受MIT许可证的许可 - 请参阅 LICENSE 文件以获取详细信息。

无运行时依赖