1 个不稳定版本
0.1.0 | 2020年4月13日 |
---|
#6 in #xls
195KB
112 行
我遇到了一些XLS文件,这些文件无法被xlrd、pandas、openpyxl、calamine等工具解析。
这些文件似乎以以下属性呈现XML格式:
工作簿
工作表
表格
行
单元格
数据
样式
样式
数字格式
字体
对齐
不清楚是什么原因导致这些文件不能被XLS和XLSX解析器读取。
本项目读取仅包含上述属性的XLS文件(XML格式文档)并尽可能输出TSV。
$ cp /path/to/file.xls input.xls
$ cargo run > out.tsv
$ less -S out.tsv
如何实现?
它只是一个serde规范,使用serde-xml-rs
。
如果您的源文档包含上述定义之外的内容,则可能需要修改代码。
依赖关系
~1–1.6MB
~36K SLoC