#xls #xml #parser #style #font #table #alignment

app xml-xls-parser

将XLS文件解析为XML

1 个不稳定版本

0.1.0 2020年4月13日

#6 in #xls

MIT/Apache

195KB
112

我遇到了一些XLS文件,这些文件无法被xlrd、pandas、openpyxl、calamine等工具解析。

这些文件似乎以以下属性呈现XML格式:

  • 工作簿
  • 工作表
  • 表格
  • 单元格
  • 数据
  • 样式
  • 样式
  • 数字格式
  • 字体
  • 对齐

不清楚是什么原因导致这些文件不能被XLS和XLSX解析器读取。

本项目读取仅包含上述属性的XLS文件(XML格式文档)并尽可能输出TSV。

$ cp /path/to/file.xls input.xls
$ cargo run > out.tsv
$ less -S out.tsv

如何实现?

它只是一个serde规范,使用serde-xml-rs

如果您的源文档包含上述定义之外的内容,则可能需要修改代码。

依赖关系

~1–1.6MB
~36K SLoC