#wikipedia #wikidata #api #wikimedia #api-bindings #batch

bin+lib tools_interface

多个与 Wikipedia/Wikimedia/Wikidata 相关工具的抽象

7 个版本

0.1.6 2024年6月3日
0.1.5 2024年6月3日
0.1.4 2024年5月31日

3#wikipedia

每月25 次下载

MIT/Apache

9MB
11K SLoC

TypeScript 5.5K SLoC // 0.2% comments • Rust 包仓库 Rust 3K SLoC // 0.0% comments • Rust 包仓库 Python 1.5K SLoC // 0.2% comments • Rust 包仓库 HCL 292 SLoC // 0.0% comments • Rust 包仓库 Shell 165 SLoC // 0.2% comments • Rust 包仓库 JavaScript 157 SLoC // 0.0% comments • Rust 包仓库 Java 145 SLoC // 0.1% comments • Rust 包仓库 Go 143 SLoC // 0.2% comments • Rust 包仓库 C++ 128 SLoC // 0.3% comments • Rust 包仓库 Kotlin 100 SLoC // 0.1% comments • Rust 包仓库 PowerShell 88 SLoC // 0.1% comments • Rust 包仓库 Batch 71 SLoC • Rust 包仓库 SQL 31 SLoC • Rust 包仓库 C# 30 SLoC // 0.3% comments • Rust 包仓库 Visual Studio Solution 28 SLoC • Rust 包仓库 Ruby 25 SLoC • Rust 包仓库 Swift 18 SLoC // 0.1% comments • Rust 包仓库 Open Policy Agent 16 SLoC • Rust 包仓库 Jinja2 15 SLoC • Rust 包仓库 Dart 13 SLoC • Rust 包仓库 Lua 13 SLoC • Rust 包仓库 PHP 8 SLoC • Rust 包仓库 CUDA 7 SLoC • Rust 包仓库 Bazel 5 SLoC • Rust 包仓库 VB6 5 SLoC • Rust 包仓库 Scala 4 SLoC • Rust 包仓库 Haml 3 SLoC • Rust 包仓库 Jupyter Notebooks 3 SLoC // 0.5% comments • Rust 包仓库 Perl 2 SLoC // 0.5% comments • Rust 包仓库

包含 (ZIP 文件, 8.5MB) ticket-monster.war, (JAR 文件, 62KB) gradle-wrapper.jar, (ZIP 文件, 8KB) jboss-helloworld.war

工具接口

这个 Rust 包实现了结构体,以便轻松与多个 Wikipedia/Wikidata/Wikimedia 工具和 API 进行接口。

支持的工具

如果您想看到支持其他工具,请在 问题跟踪器 中添加请求。

二进制文件

这里有一个 ti 二进制文件,作为 tools_interface 库的命令行界面工作。它允许您从 shell 运行针对各种 Wikimedia 工具的查询。

使用 ti help 获取子命令列表,并使用 ti help <subcommand> 获取特定子命令的帮助。

默认输出格式是 JSON,因此您可以将其输出通过 jq 进行下游处理。页面列在 .pages 数组中,每个页面都有一个 title、一个 prefixed_title 和一个 namespace_id。每个页面都可以有额外的字段,具体取决于使用的工具。包含结果网站的 wiki、语言和项目的 .site 对象。

示例:使用已知 PSID 运行 PetScan 查询,并覆盖两个参数

ti petscan --id 28348714 --params "foo=bar" "baz=123"

示例:在德语 Wikipedia 上对“生物”文章运行缺失主题,不包含模板链接

ti missing_topics --wiki dewiki --article Biologie --no_template_links

要将输出转换为更易于阅读的格式,您可以使用 jq

# First, pipe your output to a file:
ti SOME_COMMAND > test.json
# Assuming you just want the page titles:
jq -r '.pages[].prefixed_title' < test.json
# Assuming the output has additional `counter` fields:
jq -r '.pages[] | "\(.prefixed_title)\t\(.counter)"' < test.json

依赖项

~13–26MB
~395K SLoC