#xml-parser #xml #parser #streaming-parser #xml-element #interface #element-attributes

xml-rsl

一个类似 SAX 的流式 XML 解析器,以及基于该解析器的类似 DOM 的接口

3 个不稳定版本

0.2.0 2024 年 3 月 4 日
0.1.1 2024 年 3 月 4 日
0.1.0 2024 年 3 月 4 日

#4 in #xml-element

45 每月下载量
用于 2 crates

Apache-2.0

62KB
1.5K SLoC

RustyXML

Build Status

文档

RustyXML 是一个用 Rust 编写的命名空间感知 XML 解析器。目前它提供了一个基本的类似 SAX 的 API,以及基于此的 ElementBuilder。

该解析器本身是从 ObjFW 中的 OFXMLParser 衍生的,如https://webkeks.org/objfw/

当前的限制包括

  • 不完整的错误检查
  • 不稳定的 API

此 crate 所需的最小 Rust 版本为 Rust 1.40.0。

示例

将字符串解析到 Element 结构体中

use xml::Element;

let elem: Option<Element> = "<a href='//example.com'/>".parse();

从解析字符串数据中获取事件

use xml::{Event, Parser};

// Create a new Parser
let mut p = Parser::new();

// Feed data to be parsed
p.feed_str("<a href");
p.feed_str("='//example.com'/>");

// Get events for the fed data
for event in p {
    match event.unwrap() {
        Event::ElementStart(tag) => println!("<{}>", tag.name),
        Event::ElementEnd(tag) => println!("</{}>", tag.name),
        _ => ()
    }
}

这将打印

<a>
</a>

Parser Event 中构建 Element

use xml::{Parser, ElementBuilder};

let mut p = xml::Parser::new();
let mut e = xml::ElementBuilder::new();

p.feed_str("<a href='//example.com'/>");
for elem in p.filter_map(|x| e.handle_event(x)) {
    match elem {
        Ok(e) => println!("{}", e),
        Err(e) => println!("{}", e),
    }
}

手动构建 Element

let mut reply = xml::Element::new("iq".into(), Some("jabber:client".into()),
                                  vec![("type".into(), None, "error".into()),
                                       ("id".into(), None, "42".into())]);
reply.tag(xml::Element::new("error".into(), Some("jabber:client".into()),
                            vec![("type".into(), None, "cancel".into())]))
     .tag_stay(xml::Element::new("forbidden".into(),
                                 Some("urn:ietf:params:xml:ns:xmpp-stanzas".into()),
                                 vec![]))
     .tag(xml::Element::new("text".into(),
                            Some("urn:ietf:params:xml:ns:xmpp-stanzas".into()),
                            vec![]))
     .text("Permission denied".into());

结果(添加了一些空白以提高可读性)

<iq xmlns='jabber:client' id='42' type='error'>
  <error type='cancel'>
    <forbidden xmlns='urn:ietf:params:xml:ns:xmpp-stanzas'/>
    <text xmlns='urn:ietf:params:xml:ns:xmpp-stanzas'>Permission denied</text>
  </error>
</iq>

属性顺序

默认情况下,不跟踪属性的顺序。因此,在序列化和迭代过程中,它们的顺序将是随机的。可以通过启用 ordered_attrs 功能来更改这一点。启用此功能后,解析时遇到的属性顺序或添加到 Element 的属性顺序将被保留。

许可证

根据您选择的以下任一许可证

任选。

贡献

除非您明确声明,否则根据 Apache-2.0 许可证定义,您提交的任何有意包含在作品中的贡献,将按上述方式双重许可,不附加任何额外条款或条件。

依赖关系

~90MB
~1.5M SLoC