#tesseract #ocr #image #leptonica

leptess

为Tesseract和Leptonica提供的生产级Rust绑定

27个不稳定版本

使用旧的Rust 2015

0.14.0 2023年2月21日
0.13.4 2022年9月26日
0.13.2 2021年12月9日
0.13.1 2021年8月31日
0.6.0 2019年7月6日

#246 in 图像

Download history 187/week @ 2024-03-13 200/week @ 2024-03-20 202/week @ 2024-03-27 304/week @ 2024-04-03 162/week @ 2024-04-10 157/week @ 2024-04-17 172/week @ 2024-04-24 235/week @ 2024-05-01 278/week @ 2024-05-08 223/week @ 2024-05-15 157/week @ 2024-05-22 178/week @ 2024-05-29 176/week @ 2024-06-05 179/week @ 2024-06-12 186/week @ 2024-06-19 186/week @ 2024-06-26

761 每月下载量
用于 3 crate

MIT 许可证

2MB
2K SLoC

Leptess

Test Crates.io Docs

为Tesseract和Leptonica提供生产级和安全性的Rust绑定/包装器。

构建依赖项

确保您已安装clang、Leptonica和Tesseract。

Tesseract应该是4.0.0或更高版本。

Ubuntu

sudo apt-get install libleptonica-dev libtesseract-dev clang

您还需要根据您的OCR需求安装tesseract语言数据

sudo apt-get install tesseract-ocr-eng

Mac

brew install tesseract leptonica

Windows

在Windows上,此库使用Microsoft的vcpkg提供tesseract。

请安装vcpkg并设置用户级集成,否则vcpkg crate将无法找到库。

安装tesseract

REM from the vcpkg directory

REM 32 bit
.\vcpkg install tesseract:x86-windows

REM 64 bit
.\vcpkg install tesseract:x64-windows

要运行测试,需要配置vcpkg-crate以找到tesseract库

SET VCPKGRS_DYNAMIC=true
cargo test

用法

let mut lt = leptess::LepTess::new(None, "eng").unwrap();
lt.set_image("path/to/page.bmp");
println!("{}", lt.get_utf8_text().unwrap());

有关更多示例,请参阅文档examples目录。

要在examples目录中运行演示,请尝试

cargo run --example low_level_ocr_full_page

开发

要运行测试,您需要Tesseract 4.x或5.x以匹配我们在tests/tessdata/eng.traineddata中拥有的版本。请参阅GitHub配置操作以了解如何复制设置。

依赖关系