#notebook #grep #jupyter #command-line #line-search

应用 jrep

用于 Jupyter 笔记本的命令行搜索工具

1 个不稳定版本

0.1.3 2022年11月23日

#16#jupyter

自定义许可协议

33KB
500

jrep

jrep 是 Jupyter 笔记本的 grep 工具。它是一个命令行程序,可以在多个笔记本中搜索特定文本,但限制在特定类型的单元格、源文本、输出数据或任何组合。这是为了避免 grep 匹配输出数据中的字符串字符(如图像)而构建的。

安装

最新版本包含 64 位 Windows、Mac 和 Linux 可执行文件。安装 jrep 最简单的方法是下载适用于您计算机的可执行文件,解压它,使 jrep 文件可执行,并将其放置在您的 PATH 上的某个位置。如果您在运行这些可执行文件时遇到任何问题,请在此处打开一个问题。

您还可以下载源代码并在本地编译它。这需要安装 Rust,安装后,在仓库中运行 make release 将编译程序。编译好的程序将在仓库文件夹中的 target/release/jrep

快速入门

一旦程序在您的 PATH 目录中,您就可以像调用 grep 一样调用它。最简单的是提供要搜索的模式和一个或多个文件。该模式被视为正则表达式。这是使用 Rust regex crate 实现的,因此其使用的语法在 此处 描述。

  • 搜索笔记本 example.ipynb 中关于 "CO2" 的任何提及
jrep CO2 example.ipynb
  • 在当前目录中的所有笔记本中搜索 "co2",忽略大小写
jrep -i co2 *.ipynb
  • 搜索笔记本中的日期,格式为 YYYY-MM-DD 或 YYYYMMDD。请注意,搜索模式在引号中 - 这是因为终端外壳通常将类似于 \d 的字符串视为特殊字符,而不是字面意义上的反斜杠+d。
jrep '\d{4}-?\d{2}-?\d{2}' *.ipynb

要查看可用选项的列表,请使用 jrep -hjrep --help。在实用的情况下,jrep 模仿 grep 命令行选项。

限制

这是一个早期版本,因此在某些情况下可能无法正常工作——一些笔记本电脑可能缺少预期元素或结构不同于预期。并非所有 grep 选项都已实现;一些(如 --count 和上下文选项)是计划中的,其他将不会添加,因为它们对于笔记本来说没有意义。

依赖项

~3.5–6MB
~102K SLoC