在 Web编程中排名第 187

每月下载量 371 次

MIT 许可证

16KB
215 行

Spider Cloud CLI

Spider Cloud CLI 是一个用于与 Spider Cloud 网络爬虫交互的命令行界面。它允许您通过简单的命令进行抓取、爬取、搜索以及执行其他各种网络相关任务。

安装

使用 homebrew 或 cargo 从 crates.io 安装 CLI

brew tap spider-rs/spider-cloud-cli
brew install spider-cloud-cli

cargo install spider-cloud-cli

安装后，您可以通过输入 spider-cloud-cli 后跟命令及其相应参数来使用 CLI。

在使用大多数命令之前，您需要通过提供API密钥进行身份验证

spider-cloud-cli auth --api_key YOUR_API_KEY

从指定的URL抓取数据。

spider-cloud-cli scrape --url http://example.com

爬取指定的URL，可选地限制页面数量。

spider-cloud-cli crawl --url http://example.com --limit 10

从指定的URL获取链接。

spider-cloud-cli links --url http://example.com

对指定的URL进行截图。

spider-cloud-cli screenshot --url http://example.com

搜索查询。

spider-cloud-cli search --query "example query"

转换指定数据。

spider-cloud-cli transform --data "sample data"

从指定的URL提取联系人信息。

spider-cloud-cli extract_contacts --url http://example.com

标记指定URL的数据。

spider-cloud-cli label --url http://example.com

获取指定URL的爬取状态。

spider-cloud-cli get_crawl_state --url http://example.com

查询指定域的记录。

spider-cloud-cli query --domain example.com

获取账户剩余积分。

spider-cloud-cli get_credits

本项目采用 MIT 许可证。有关详细信息，请参阅 LICENSE 文件。

欢迎提交问题和拉取请求！如果您有任何问题或建议，请随时查看问题页面。

特别感谢本项目使用的库和工具的开发者和贡献者。

~7–19MB
~282K SLoC