#xlsx #导入导出 #usv #导出 #导入 #Unicode 字符 #数据

程序+库 xlsx-to-usv

将 Microsoft Excel (XLSX) 转换为 Unicode 分隔值 (USV) 以进行数据标记,包括电子表格、数据库、文本文件等

12 个版本 (稳定版)

1.2.4 2024年4月11日
1.2.2 2024年4月4日
1.2.1 2024年3月26日
0.4.0 2024年3月21日
0.1.0 2024年3月18日

#1736 in 编码

Download history 10/week @ 2024-04-14 8/week @ 2024-06-30 36/week @ 2024-07-07 56/week @ 2024-07-28

每月下载量 92

MIT OR Apache-2.0 OR GPL-2.0 OR GPL-3.0

33KB
353

xlsx-to-usv

Microsoft Excel (XLSX) 转换为 Unicode 分隔值 (USV)。使用 USV Rust 包 构建。

语法

stdin | xlsx-to-usv [options] | stdout

示例

cat example.xlsx | xlsx-to-usv

以下有更多示例。

选项

USV 分隔符和修饰符选项

  • -u, --unit-separator : 设置单元分隔符(US)字符串。

  • -r, --record-separator : 设置记录分隔符(RS)字符串。

  • -g, --group-separator : 设置组分隔符(GS)字符串。

  • -f, --file-separator : 设置文件分隔符(FS)字符串。

  • -e, --escape : 设置转义(ESC)字符串。

  • -z, --end-of-transmission : 设置传输结束(EOT)字符串。

USV 风格选项

  • --style-braces : 设置使用花括号的风格,例如使用 "{US}" 作为单元分隔符。

  • --style-controls : 设置使用控制字符的风格,例如使用 "\u{001F}" 作为单元分隔符。

  • --style-symbols : 设置使用符号的风格,例如使用 "␟" 作为单元分隔符。

USV 布局选项

  • --layout-0: 不围绕每个项目显示行。这是无布局,换句话说,是一行。

  • --layout-1: 围绕每个项目显示一行。这是类似单空格行的长文本。

  • --layout-2: 围绕每个项目显示两行。这是类似双空格行的长文本。

  • --layout-units: 在一行上显示每个单元。这对于面向行的工具可能很有帮助。

  • --layout-records: 在一行上显示每个记录。这类似于典型的电子表格导出。

  • --layout-groups: 在一行上显示每个组。这对于面向卷的工具可能很有帮助。

  • --layout-files: 在一行上显示一个文件。这对于面向存档的工具可能很有帮助。

命令行工具选项

  • -h, --help : 打印帮助

  • -V, --version : 打印版本

  • -v, --verbose... : 设置详细程度:0=无,1=错误,2=警告,3=信息,4=调试,5=跟踪。示例:--verbose …

  • –test : 用于打印测试输出以进行调试、验证、跟踪等。例如:–test

安装

安装

cargo install xlsx-to-usv

链接:https://crates.io/crates/xlsx-to-usv

示例

Excel和USV具有类似的数据概念

Excel USV
工作簿 文件
工作表 分组
记录
单元格 单元

假设文件example.xlsx包含此类数据

Worksheet 1
a,b
c,d

Worksheet 2
d,e
f,g

运行

cat example.xlsx | xlsx-to-usv

输出

Worksheet 1␟␞
a␟b␟␞
c␟d␟␞
␝
Worksheet 2␟␞
e␟f␟␞
g␟h␟␞
␝

如果您更喜欢使用零宽度字符控制的ASCII分隔值(ASV)

运行

cat example.xlsx | xlsx-to-usv --style-controls

输出

Worksheet 1\u{001F}\u{001E}
a\u{001F}b\u{001F}\u{001E}
c\u{001F}d\u{001F}\u{001E}
\u{001D}
Worksheet 2\u{001F}\u{001E}
e\u{001F}f\u{001F}\u{001E}
g\u{001F}h\u{001F}\u{001E}
\u{001D}

如果您更喜欢使用花括号来渲染标记,以便更容易地看到标记

cat example.xlsx | xlsx-to-usv --style-braces

输出

Worksheet 1{US}{RS}
a{US}b{US}{RS}
c{US}d{US}{RS}
{GS}
Worksheet 2{US}{RS}
e{US}f{US}{RS}
g{US}h{US}{RS}
{GS}

更多信息,请参阅官方仓库
Unicode分隔值(USV)

常见问题解答(FAQ)

有哪些可用的转换器?

何时使用此命令?

当您想将XLSX转换为USV时使用此命令。

一个典型用例是,当您拥有XLSX数据,例如电子表格文件,并且希望将其转换为USV,例如使数据更容易在终端中查看、在文本编辑器中编辑或在文本格式中维护时。

我们的实际用例是将来自各种程序(包括Excel)的大量XLSX电子表格导出转换为USV,这样我们就能更好地处理引号、多行数据单元以及各种人类语言的Unicode字符。

USV是否旨在成为标准?

是的,USV已提交给IETF.org作为进行中的Internet-Draft工作:[链接](https://datatracker.ietf.org/doc/draft-unicode-separated-values/)

我可以构建自己的USV工具吗?

可以,您可以自由使用USV RFCUSV Rust crate

需要帮助

欢迎建设性的反馈。欢迎拉取请求和功能请求。

跟踪

  • 包:xlsx-to-usv-rust-crate
  • 版本:1.2.4
  • 创建时间:2024-03-09T13:33:20Z
  • 更新时间:2024-04-11T18:32:40Z
  • 许可证:MIT或Apache-2.0或GPL-2.0或GPL-3.0或联系我们获取更多信息
  • 联系方式:Joel Parker Henderson ([email protected])

依赖项

~7.5MB
~198K SLoC