8个版本
使用旧的Rust 2015
0.3.0 | 2023年12月20日 |
---|---|
0.2.0 | 2021年4月1日 |
0.1.5 | 2019年5月7日 |
0.1.4 | 2018年2月17日 |
0.1.2 | 2017年11月13日 |
#281 in 文本处理
2,388 每月下载量
用于 15 个crates (12 直接)
26KB
697 行
readability-rs
readability-rs 是一个用于提取网页主要可读内容的库。这是arc90的可读性项目的Rust移植版本。受 kingwkb/readability 启发。
如何使用
- 将
readability
添加到 Cargo.toml 中的依赖项
[dependencies]
readability = "^0"
- 然后,如下使用它
extern crate readability;
use readability::extractor;
fn main() {
match extractor::scrape("https://spincoaster.com/chromeo-juice") {
Ok(product) => {
println!("------- html ------");
println!("{}", product.content);
println!("---- plain text ---");
println!("{}", product.text);
},
Err(_) => println!("error occured"),
}
}
示例
访问 示例页面。
相关项目
许可证
依赖项
~8–20MB
~325K SLoC