1 个不稳定版本
0.1.3 | 2022年11月23日 |
---|
#16 在 #jupyter
33KB
500 行
jrep
jrep 是 Jupyter 笔记本的 grep 工具。它是一个命令行程序,可以在多个笔记本中搜索特定文本,但限制在特定类型的单元格、源文本、输出数据或任何组合。这是为了避免 grep
匹配输出数据中的字符串字符(如图像)而构建的。
安装
最新版本包含 64 位 Windows、Mac 和 Linux 可执行文件。安装 jrep
最简单的方法是下载适用于您计算机的可执行文件,解压它,使 jrep
文件可执行,并将其放置在您的 PATH 上的某个位置。如果您在运行这些可执行文件时遇到任何问题,请在此处打开一个问题。
您还可以下载源代码并在本地编译它。这需要安装 Rust,安装后,在仓库中运行 make release
将编译程序。编译好的程序将在仓库文件夹中的 target/release/jrep
。
快速入门
一旦程序在您的 PATH
目录中,您就可以像调用 grep
一样调用它。最简单的是提供要搜索的模式和一个或多个文件。该模式被视为正则表达式。这是使用 Rust regex
crate 实现的,因此其使用的语法在 此处 描述。
- 搜索笔记本
example.ipynb
中关于 "CO2" 的任何提及
jrep CO2 example.ipynb
- 在当前目录中的所有笔记本中搜索 "co2",忽略大小写
jrep -i co2 *.ipynb
- 搜索笔记本中的日期,格式为 YYYY-MM-DD 或 YYYYMMDD。请注意,搜索模式在引号中 - 这是因为终端外壳通常将类似于
\d
的字符串视为特殊字符,而不是字面意义上的反斜杠+d。
jrep '\d{4}-?\d{2}-?\d{2}' *.ipynb
要查看可用选项的列表,请使用 jrep -h
或 jrep --help
。在实用的情况下,jrep
模仿 grep
命令行选项。
限制
这是一个早期版本,因此在某些情况下可能无法正常工作——一些笔记本电脑可能缺少预期元素或结构不同于预期。并非所有 grep
选项都已实现;一些(如 --count
和上下文选项)是计划中的,其他将不会添加,因为它们对于笔记本来说没有意义。
依赖项
~3.5–6MB
~102K SLoC