8个版本

使用旧的Rust 2015

0.3.0 2023年12月20日
0.2.0 2021年4月1日
0.1.5 2019年5月7日
0.1.4 2018年2月17日
0.1.2 2017年11月13日

#281 in 文本处理

Download history 283/week @ 2024-04-08 249/week @ 2024-04-15 405/week @ 2024-04-22 660/week @ 2024-04-29 471/week @ 2024-05-06 481/week @ 2024-05-13 498/week @ 2024-05-20 652/week @ 2024-05-27 631/week @ 2024-06-03 410/week @ 2024-06-10 487/week @ 2024-06-17 631/week @ 2024-06-24 515/week @ 2024-07-01 668/week @ 2024-07-08 563/week @ 2024-07-15 561/week @ 2024-07-22

2,388 每月下载量
用于 15 个crates (12 直接)

MIT 许可证

26KB
697

readability-rs

Build Status

readability-rs 是一个用于提取网页主要可读内容的库。这是arc90的可读性项目的Rust移植版本。受 kingwkb/readability 启发。

如何使用

  • readability 添加到 Cargo.toml 中的依赖项
[dependencies]
readability = "^0"
  • 然后,如下使用它

extern crate readability;
use readability::extractor;

fn main() {
  match extractor::scrape("https://spincoaster.com/chromeo-juice") {
      Ok(product) => {
          println!("------- html ------");
          println!("{}", product.content);
          println!("---- plain text ---");
          println!("{}", product.text);
      },
      Err(_) => println!("error occured"),
  }
}

示例

访问 示例页面

许可证

MIT

依赖项

~8–20MB
~325K SLoC