-
prometheus-parse
Prometheus文本格式的解析器
-
visdom
一个HTML文档语法和操作库,使用类似jQuery的API,易于进行网页抓取和解析HTML
-
article_scraper
从网页抓取文章内容。由fivefilters全文订阅配置和mozilla可读性提供支持。
-
flipkart_scraper
抓取Flipkart产品详情
-
firecrawl_rs
Firecrawl API的Rust SDK
-
readability
将arc90的可读性项目移植到Rust
-
firecrawl
Firecrawl API的Rust SDK
-
soda_clix
-
only_scraper
仅抓取网页
-
serpapi
将搜索数据集成到您的Ruby应用程序中。此库是SerpApi的官方包装器。SerpApi支持Google、Google Maps、Google Shopping、Baidu、Yandex、Yahoo、eBay、应用商店等。
-
waper
用于抓取HTML网站的命令行工具
-
serpapi-search-rust
通过 SerpApi.com 获取 Google、Bing、Baidu、Ebay、Yahoo、Yandex、家得宝、Naver、Apple、youtube 搜索结果
-
web-scraper
用于从网站获取 HTML 并抓取其中内容的工具
-
ytmdl
从 YouTube 下载专辑,并自动使用 Discogs 的元数据填充
-
iocutil
针对恶意软件研究人员的 IoC 工具
-
quick_crawler
QuickCrawler 是一个 Rust 库,提供完全异步、声明式的网络爬虫,内置了域特定请求速率限制
-
#scrape
rust-recipe
-
scraper-main
核心框架 xpath 解析
-
nitter-scraper
抓取 Nitter 网站的工具
-
webscrapingapi
通过使用旋转代理防止封禁,允许从网站抓取的 API。此 SDK 为 Rust 使 API 在任何项目中实施变得更加容易。
-
image_scrapper
从网站抓取图像,同时跳过重复的图像
-
htable2csv
将 HTML 表格转换为 .csv 文件
-
fs_scraper
用于 FjalorShqip 的抓取工具
-
trillium-prometheus
用于Prometheus度量抓取的Trillium处理器
-
readability-fork
'readability' crate的临时分支,依赖项已更新
-
prom_text_format_parser
解析并打印Prometheus曝光文本格式
-
links_js
从javascript中抓取链接 🧬
-
links_html
从html中抓取链接 🧬
-
blog-replay
将博客存档重新播放到Atom订阅源
-
canadian_news_scraper
提供API抓取3个加拿大新闻网站并返回数据
-
wadachi
抓取GitHub活动
-
urls2disk
将url下载到磁盘的http客户端,可选地转换为PDF
-
scwape
通过CSS选择器抓取网络
-
sv_menu_scraper
允许您抓取如"https://bkw-bern.sv-restaurant.ch/de/menuplan/"这样的sv_restaurant菜单网站
-
stock-scrape
股票抓取器
-
scraper-macros
#[derive(Scraper)]的宏实现
-
googlescrape
抓取谷歌结果
-
rightscrape
从stdin读取rightmove搜索URL,输出rightmove结果URL
-
stork_http
基于HTML的网页爬取的第一方stork实现
-
mangadex-scraper
从mangadex.org抓取漫画
尝试使用 DuckDuckGo 进行搜索。搜索.