15个版本

0.1.7 2024年8月12日
0.1.5 2024年7月30日
0.0.14 2024年7月3日
0.0.13 2024年6月22日
0.0.3 2023年10月30日

#1482 in Web编程

Download history 4/week @ 2024-05-19 9/week @ 2024-05-26 142/week @ 2024-06-02 41/week @ 2024-06-09 291/week @ 2024-06-16 43/week @ 2024-06-23 260/week @ 2024-06-30 36/week @ 2024-07-07 22/week @ 2024-07-14 130/week @ 2024-07-28 13/week @ 2024-08-04 149/week @ 2024-08-11

每月294次下载
8 个crates中(7个直接)使用

MIT/Apache

510KB
13K SLoC

SHAPES-rs

Shapes-rs dependency status

本仓库包含一个在Rust中实现的RDF数据形状库。该实现支持ShExSHACLDCTap以及不同RDF数据建模形式之间的转换。

代码可以作为Rust库使用,但它还包含一个名为rdfsx的二进制文件,可以用作RDF沙盒。

我们提供了Linux、Windows、Mac和Docker的二进制文件(见发布),以及Python绑定。

安装

官方版本

您可以从最新版本页面下载二进制文件。在那里,您还可以找到用于在系统上使用包管理器安装的编译包。

Ubuntu

https://github.com/weso/shapes-rs/releases下载二进制文件,然后运行以下命令安装.deb包,将X.X.X替换为最新版本

wget https://github.com/weso/shapes-rs/releases/download/X.X.X/rdfsx_vX.X.X_amd64.deb
sudo dpkg -i rdfsx_vX.X.X_amd64.deb

Windows

可以从https://github.com/weso/shapes-rs/releases下载二进制文件

Mac

二进制文件可在https://github.com/weso/shapes-rs/releases找到

从源码编译

从源码编译

shapes-rs是用Rust实现的,并使用cargo编译的。可以使用cargo run命令在本地编译和运行代码。

例如

cargo run -- validate --data examples/user.ttl --schema examples/user.shex --shapemap examples/user.sm 

从源码编译并安装二进制文件(Debian)

安装 cargo deb (仅第一次)

cargo install cargo-deb

通过以下方式创建 .deb 软件包

cargo deb

并运行

sudo dpkg -i target/debian/shapes-rs_0.0.11-1_amd64.deb

Docker

该库也以 Docker 镜像的形式发布。

使用方法

一些示例

文件夹 examples 包含几个带有 ShEx 模式和 RDF 数据的示例文件。

使用 ShapeMap 验证一个简单的 RDF 文件与 ShEx 模式

rdfsx validate --data examples/user.ttl --schema examples/user.shex --shapemap examples/user.sm

我们维护一个 Wiki 页面,其中包含一些常见的 使用场景和指南

调试信息

可以通过以下方式更改调试级别信息:

export RUST_LOG=value

其中 value 可以是 debug 以显示更详细的信息或 info 以显示基本信息。

命令行使用

RDF Data shapes implementation in Rust

Usage: rdfsx [OPTIONS] [COMMAND]

Commands:
  shapemap        Information about ShEx shapemaps
  shex            Information about ShEx schemas
  validate        RDF Validation using ShEx or SHACL
  shex-validate   RDF Validation using ShEx schemas
  shacl-validate  RDF Validation using SHACL shapes
  data            Information about RDF data
  node            Information about RDF nodes which are part of RDF Graphs
  shacl           Information about SHACL shapes
  dctap           Information and processing of DCTAP files
  convert         Conversion between different Data modeling technologies
  help            Print this message or the help of the given subcommand(s)

Options:
  -d, --debug...  
  -h, --help      Print help (see more with '--help')
  -V, --version   Print version

获取关于 ShEx 模式的信息

$ rdfsx shex --help
Information about ShEx schemas

Usage: rdfsx shex [OPTIONS] --schema <Schema file name>

Options:
  -s, --schema <Schema file name>
          
  -f, --format <Schema format>
          [default: shexc] [possible values: internal, shexc, shexj, turtle, ntriples, rdfxml, trig, n3, nquads]
  -r, --result-format <Result schema format>
          [default: shexj] [possible values: internal, shexc, shexj, turtle, ntriples, rdfxml, trig, n3, nquads]
  -t, --show elapsed time
          
      --statistics
          
  -o, --output-file <Output file name, default = terminal>
          
  -h, --help
          Print help

获取关于 RDF 数据的信息

$ rdfsx data --help
Information about RDF data

Usage: rdfsx data [OPTIONS] --data <RDF data path>

Options:
  -d, --data <RDF data path>
          
  -t, --data-format <RDF Data format>
          [default: turtle] [possible values: turtle, ntriples, rdfxml, trig, n3, nquads]
  -o, --output-file <Output file name, default = terminal>
          
  -h, --help
          Print help

获取关于 RDF 数据中节点的信息

此命令可以用于获取节点的邻域。

$ rdfsx node --help
Information about RDF nodes which are part of RDF Graphs

Usage: rdfsx node [OPTIONS] --node <NODE>

Options:
  -n, --node <NODE>
          
  -d, --data <RDF data path>
          
  -t, --data-format <RDF Data format>
          [default: turtle] [possible values: turtle, ntriples, rdfxml, trig, n3, nquads]
  -e, --endpoint <Endpoint with RDF data>
          
  -m, --show-node-mode <Show Node Mode>
          [default: outgoing] [possible values: outgoing, incoming, both]
      --show hyperlinks
          
  -p, --predicates <PREDICATES>
          
  -o, --output-file <Output file name, default = terminal>
          
  -h, --help
          Print help

例如,以下命令显示了 Wikidata 端点中节点 wd:Q80 的邻域。

rdfsx node -e wikidata -n wd:Q80

验证 RDF 节点与某些数据

$ rdfsx validate --help
RDF Validation using ShEx or SHACL

Usage: rdfsx validate [OPTIONS] --schema <Schema file name>

Options:
  -M, --mode <Validation mode>
          [default: shex] [possible values: shex, shacl]
  -s, --schema <Schema file name>
          
  -f, --schema-format <Schema format>
          [default: shexc] [possible values: internal, shexc, shexj, turtle, ntriples, rdfxml, trig, n3, nquads]
  -m, --shapemap <ShapeMap file name>
          
      --shapemap-format <ShapeMap format>
          [default: compact] [possible values: compact, internal]
  -n, --node <NODE>
          
  -l, --shape-label <shape label (default = START)>
          
  -d, --data <RDF data path>
          
  -t, --data-format <RDF Data format>
          [default: turtle] [possible values: turtle, ntriples, rdfxml, trig, n3, nquads]
  -e, --endpoint <Endpoint with RDF data>
          
      --max-steps <max steps to run>
          [default: 100]
  -o, --output-file <Output file name, default = terminal>
          
  -h, --help
          Print help

示例:假设有一个位于 examples/user.shex 的 ShEx 文件和一个位于 examples/user.ttl 的 RDF turtle 文件,我们可以要求使用以下方法验证节点 :a 与形状标签 :User

rdfsx validate -s examples/user.shex -d examples/user.ttl -n :a -l :User

如果 examples/user.sm 中有一个 shapemap,我们可以使用以下方式验证:

rdfsx validate -s examples/user.shex -d examples/user.ttl -m examples/user.sm

验证 RDF 节点与某些 SHACL 形状

rdfsx shacl-validate --shapes examples/simple_shacl.ttl --data examples/simple.ttl

形状形式之间的转换

$ rdfsx convert --help
Conversion between different Data modeling technologies

Usage: rdfsx convert [OPTIONS] --input-mode <Input mode> --source-file <Source file name> --export-mode <Result mode>

Options:
  -m, --input-mode <Input mode>
          [possible values: shex, dctap]
  -s, --source-file <Source file name>
          
  -f, --format <Input file format>
          [default: shexc] [possible values: csv, shexc, shexj, turtle]
  -r, --result-format <Result format>
          [default: default] [possible values: default, internal, json, shexc, shexj, turtle, plantuml, html, svg, png]
  -o, --output-file <Output file name, default = terminal>
          
  -t, --target-folder <Target folder>
          
  -l, --shape-label <shape label (default = START)>
          
  -x, --export-mode <Result mode>
          [possible values: sparql, shex, uml, html]
  -h, --help
          Print help

主要模块

仓库分为以下模块

发布 crate

cargo workspaces publish 

工作空间

该项目使用 cargo 工作空间,可以使用以下方式安装:

cargo install cargo-workspaces

单元测试

为了测试所有子项目

cargo test --all

测试特定的子项目

cargo test -p shex_validation

使用 ShEx 测试套件

ShEx 测试套件包含在一个 git 子模块中。为了获取它,需要执行以下操作:

git submodule update --init --recursive
cargo run -p shex_testsuite
Usage: shex_testsuite [OPTIONS]

Options:
  -m, --manifest <Manifest FILE (.jsonld)>
          Name of Manifest file [default: shex_testsuite/shexTest/validation/manifest.jsonld]
  -c, --config <Config file>
          [default: shex_testsuite/config.yml]
  -x, --run_mode <MANIFEST_RUN_MODE>
          [default: collect-errors] [possible values: collect-errors, fail-first-error]
  -f, --manifest_mode <MANIFEST_MODE>
          [possible values: schemas, validation, negative-syntax, negative-structure]
  -p, --print_result_mode <PRINT_RESULT_MODE>
          [default: basic] [possible values: basic, failed, passed, not-implemented, all]
  -e, --entry <Entry names>
          
  -t, --trait <Trait names>
          
  -h, --help
          Print help
  -V, --version
          Print version

ShEx 的验证一致性测试

cargo run -p shex_testsuite -- -m shex_testsuite/shexTest/validation/manifest.jsonld validation 

模式测试

cargo run -p shex_testsuite -- -m shex_testsuite/shexTest/schemas/manifest.jsonld -f schemas -p failed

许可协议

以下任一许可协议下授权:

根据您的选择。

贡献者

贡献

除非您明确表示,否则根据 Apache-2.0 许可证定义的,您有意提交以包含在工作中的任何贡献,都将按照上述方式双授权,而不附加任何额外的条款或条件。


lib.rs:

此模块定义了 ShapeMaps

ShapeMaps 被用于 ShEx 触发验证并展示验证结果。

ShapeMaps 可以将 RDF 节点与形状关联起来,表示 RDF 节点是否与这些形状相符。

依赖项

~14-27MB
~426K SLoC