#html-parser #html-xml #html #xml-parser #xml #soup #regex-parser

soupy

一个基于树的格式查询库,类似于 BeautifulSoup

13 个版本 (7 个破坏性更新)

0.8.3 2024年7月17日
0.7.2 2024年7月17日
0.1.1 2023年12月22日
0.1.0 2023年10月23日

2299解析器实现

Download history 248/week @ 2024-07-05 738/week @ 2024-07-12 132/week @ 2024-07-19 209/week @ 2024-07-26 298/week @ 2024-08-02 1183/week @ 2024-08-09 952/week @ 2024-08-16

每月下载量 2,660

MIT/Apache

59KB
1.5K SLoC

Soupy

soupy 是一个基于树的格式查询库,类似于 BeautifulSoup。

Cargo 特性

  • html: 支持 HTML。默认启用。
    • html-lenient: 兼容错误的 HTML 解析器。较慢。默认启用。
    • html-strict: 简单、快速的 HTML 解析器。默认启用。
  • xml: 支持 XML。默认启用。
  • regex: 支持查询中的正则表达式匹配。默认启用。

许可证

soupy 在 MIT 和 Apache-2.0 许可下双许可。

依赖项

~2–9MB
~70K SLoC