2 个版本
| 0.1.1 | 2024 年 8 月 4 日 |
|---|---|
| 0.1.0 | 2024 年 8 月 4 日 |
#178 在 文本处理
194 每月下载量
19KB
406 代码行
rs-tool:水库抽样工具
rs-tool 处理日志文件或来自 stdin 的按行分隔的记录流。它使用 水库抽样 在每条记录或每字段的基础上产生其输入的样本。它以表格或 JSON 格式将输出打印到 stdout。
给定一个合适的日志文件,您可以使用 rs-tool 来回答像
- 访问我的网站最常见的 IP 地址是什么?
- 哪些用户最频繁地使用
sudo命令? - 我服务的最繁忙的时间是何时?
当 rs-tool 从文件读取输入时,它使用 Rayon 并行库 并行构建和合并水库。
灵感来自 Tim Bray 的 tf。
依赖项
~7–16MB
~183K SLoC