8个版本

使用旧的Rust 2015

0.3.0 2023年12月20日
0.2.0 2021年4月1日
0.1.5 2019年5月7日
0.1.4 2018年2月17日
0.1.2 2017年11月13日

#281 in 文本处理

Download history • Rust 包仓库 283/week @ 2024-04-08 • Rust 包仓库 249/week @ 2024-04-15 • Rust 包仓库 405/week @ 2024-04-22 • Rust 包仓库 660/week @ 2024-04-29 • Rust 包仓库 471/week @ 2024-05-06 • Rust 包仓库 481/week @ 2024-05-13 • Rust 包仓库 498/week @ 2024-05-20 • Rust 包仓库 652/week @ 2024-05-27 • Rust 包仓库 631/week @ 2024-06-03 • Rust 包仓库 410/week @ 2024-06-10 • Rust 包仓库 487/week @ 2024-06-17 • Rust 包仓库 631/week @ 2024-06-24 • Rust 包仓库 515/week @ 2024-07-01 • Rust 包仓库 668/week @ 2024-07-08 • Rust 包仓库 563/week @ 2024-07-15 • Rust 包仓库 561/week @ 2024-07-22 • Rust 包仓库

2,388 每月下载量
用于 15 个crates (12 直接)

MIT 许可证

26KB
697

readability-rs

Build Status

readability-rs 是一个用于提取网页主要可读内容的库。这是arc90的可读性项目的Rust移植版本。受 kingwkb/readability 启发。

如何使用

  • readability 添加到 Cargo.toml 中的依赖项
[dependencies]
readability = "^0"
  • 然后,如下使用它

extern crate readability;
use readability::extractor;

fn main() {
  match extractor::scrape("https://spincoaster.com/chromeo-juice") {
      Ok(product) => {
          println!("------- html ------");
          println!("{}", product.content);
          println!("---- plain text ---");
          println!("{}", product.text);
      },
      Err(_) => println!("error occured"),
  }
}

示例

访问 示例页面

许可证

MIT

依赖项

~8–20MB
~325K SLoC