9次重大发布

0.10.1 2024年8月4日
0.10.0 2024年5月7日
0.9.0 2024年4月3日
0.8.0 2023年12月15日
0.2.0 2020年11月28日

#99数据库接口

Download history 177/week @ 2024-05-06 41/week @ 2024-07-22 101/week @ 2024-07-29 27/week @ 2024-08-05

169 每月下载量

Unlicense

3MB
2K SLoC

Tass

表格数据的分页器

tass - 它就像 less,但用于表格!它可以读取CSV/TSV和parquet文件。它看起来像这样

您可以看到tass的模式推断在这里是如何工作的。第四列和第五列只包含少量唯一的值,所以tass自动为它们着色。那些右边的列是数字的,所以tass将它们右对齐,并使用红色显示负值。

此演示显示了数据被管道输入到(较旧版本的)tass中。您还可以打开仍在追加的文件,当文件增长时,新行将出现。

安装

如果您已经安装了rust,您可以使用以下方式安装tass

$ cargo install tass

用法

您可以通过传递文件名或通过stdin管道数据来使用

$ tass mydata.csv
$ cat mydata.csv | tass
操作
/jPageUp 向上移动一行,翻页
/kPageDown 向下移动一行,翻页
/h 向左移动一列
/l 向右移动一列
HomeEnd 移动到文件开始/结束
数字 g 移动到第 $number
f 移动到末尾并随新行的到来自动滚动
/, ? 搜索,反向搜索字符串
nN 跳转到下一个,上一个匹配项
q/Esc 退出

与其他工具的比较

工具 功能 文件类型 将整个文件加载到内存中 流式传输
tass ⭐ 查看数据,基本搜索 CSV/TSV,parquet no 😌 ✔️
csvlens ⭐ 与tass类似 CSV/TSV no 😌 ✔️
VisiData ⭐⭐ 总结统计,绘图等 CSV/TSV,parquet,JSON,... yes 😱 ✔️
Excel/Calc/Numbers/Google Sheets ⭐⭐⭐ 它是一个电子表格! CSV/TSV,xls,ods,... yes 😱
Pandas/Polars/DataFrame.jl ⭐⭐⭐ 它是一个数据框库! CSV/TSV,parquet,... no 😌

对于数据处理,我的建议是使用电子表格(对于小型数据集)或数据框库(对于大型数据集)。有时您只是想快速检查文件的内容,这就是tass的作用。

技巧与窍门

以下是一些处理大型CSV文件的技巧

  • 如果您想查看总结统计数据,但不关心底层数据本身,您仍然可以使用VisiData/Excel等工具:只需先进行下采样即可。这将降低您的统计数据和图表的精度,但不会改变整体形状(可能)。xsv有一个子命令可以帮助您完成这个操作。
  • 如果您需要复杂问题的确切答案,请使用数据框架库。或者,考虑将CSV文件导入sqlite数据库,并使用该数据库。
  • 对于CSV文件的非正式计算,请查看frawk - 它非常好用。

依赖项

32–52MB
~1M SLoC