#pdf #text #poppler #api-bindings

pdftotext

一个高级库,绑定到 Poppler 以从 PDF 中提取文本

6 个版本

0.1.5 2020年12月16日
0.1.4 2020年12月16日

#1762 in 文本处理

29 每月下载次数

GPL-2.0 OR GPL-3.0

7MB
157K SLoC

C++ 133K SLoC // 0.1% comments C 24K SLoC // 0.0% comments Python 318 SLoC // 0.3% comments Rust 140 SLoC

pdftotext

这个 crate 将 Poppler 的 pdftotext -layout 代码提取到一个库中,动态链接到系统的 Poppler。

该库已在 Poppler 20.12.1 上进行了测试。它调用 Poppler 的内部 API,因此可能与未来库版本不兼容。如果这令人担忧,请启用 static-poppler 来构建,这将静态链接到受保护的 Poppler 20.12.1。

无运行时依赖