#html-css #css-selectors #html-text #extract #command-line #attributes #html-content

app select-html

使用命令行中的CSS选择器提取HTML

3个版本

0.1.2 2024年1月25日
0.1.1 2022年9月23日
0.1.0 2022年9月5日

#1 in #html-content

AGPL-3.0-or-later

26KB
61 代码行

选择 👁 HTML

使用命令行中的CSS选择器提取HTML。

功能

  • 使用stdin或文件输入HTML。
  • 输出完整元素、内部文本或属性值。
  • 从输出中去除多余的空白。

安装

Cargo

拥有可用的Rust和Cargo安装,您可以从Crates.io安装select-html

cargo install select-html

二进制文件

预编译的 x86_64-unknown-linux-gnu 二进制文件可在版本页面上找到。

示例

# Use stdin to pipe HTML to select-html.
curl -s https://example.org | select-html

# Or use `--file`.
select-html --file 'example.html'

# Select and output HTML.
select-html 'title'

# Output only the inner text of selected elements.
select-html '.example' --text

# Output attribute values.
select-html '[property^="og:"]' -a 'property' -a 'content'

用法

USAGE:
    select-html [OPTIONS] <SELECTOR>

ARGS:
    <SELECTOR>    The CSS selector to use

OPTIONS:
    -a, --attribute <ATTRIBUTE>    Output the attribute's value from the selected element, can be
                                   used multiple times
        --file <FILE>              A HTML file to read, if not specified stdin will be used instead
    -h, --help                     Print help information
    -t, --text                     Output inner text of the selected elements
        --trim                     Trim whitespace from selected items
    -V, --version                  Print version information

开发

安装Nix flakesdirenv并启用它们,所有必需的依赖项将从shell.nix自动加载。然后可以使用cargo-make构建、部署和检查代码。所有可用任务都在Makefile.toml配置中描述。

反馈

发现问题或想请求新功能?请发送电子邮件至[email protected],我会看看我能为你做什么。

许可证

AGPL-3.0-or-later许可证下分发,有关更多信息,请参阅LICENSE

依赖项

~8–15MB
~175K SLoC