4 个版本
0.2.2 | 2023年1月11日 |
---|---|
0.2.1 | 2022年12月26日 |
0.2.0 | 2022年12月26日 |
0.1.0 | 2022年12月25日 |
#47 in #meta
13KB
193 行
MetaScraper
MetaScraper 是一个提取网站元数据信息的库。
MetaScraper 使用 tl 作为其 HTML 解析器。这个选择是基于 tl 在基准测试中速度最快。更多信息,请访问 parse_query_bench GitHub 页面。
用法
let input = include_str!("test.html");
let metascraper = MetaScraper::parse(input).unwrap();
println!("{}", metascraper.title().unwrap());
// Title
let metadata = metascraper.metadata();
println!("{:?}", metadata);
// MetaData {
// title: Some("Title"),
// description: Some("Description"),
// canonical: Some("https://mehmetcan.sahin.dev"),
// language: Some("en"),
// rss: Some("rss.xml"),
// metatags: Some([
// Metatag { name: "X-UA-Compatible", content: "IE=edge" },
// Metatag { name: "viewport", content: "width=device-width, initial-scale=1.0" },
// Metatag { name: "description", content: "Description" }
// ])
// }
许可证
MetaScraper 根据 MIT 许可证授权。
依赖项
~145KB