27个不稳定版本
使用旧的Rust 2015
0.14.0 | 2023年2月21日 |
---|---|
0.13.4 | 2022年9月26日 |
0.13.2 | 2021年12月9日 |
0.13.1 | 2021年8月31日 |
0.6.0 | 2019年7月6日 |
#246 in 图像
761 每月下载量
用于 3 crate
2MB
2K SLoC
Leptess
为Tesseract和Leptonica提供生产级和安全性的Rust绑定/包装器。
构建依赖项
确保您已安装clang、Leptonica和Tesseract。
Tesseract应该是4.0.0或更高版本。
Ubuntu
sudo apt-get install libleptonica-dev libtesseract-dev clang
您还需要根据您的OCR需求安装tesseract语言数据
sudo apt-get install tesseract-ocr-eng
Mac
brew install tesseract leptonica
Windows
在Windows上,此库使用Microsoft的vcpkg提供tesseract。
请安装vcpkg并设置用户级集成,否则vcpkg crate将无法找到库。
安装tesseract
REM from the vcpkg directory
REM 32 bit
.\vcpkg install tesseract:x86-windows
REM 64 bit
.\vcpkg install tesseract:x64-windows
要运行测试,需要配置vcpkg-crate以找到tesseract库
SET VCPKGRS_DYNAMIC=true
cargo test
用法
let mut lt = leptess::LepTess::new(None, "eng").unwrap();
lt.set_image("path/to/page.bmp");
println!("{}", lt.get_utf8_text().unwrap());
有关更多示例,请参阅文档和examples
目录。
要在examples
目录中运行演示,请尝试
cargo run --example low_level_ocr_full_page
开发
要运行测试,您需要Tesseract 4.x或5.x以匹配我们在tests/tessdata/eng.traineddata
中拥有的版本。请参阅GitHub配置操作以了解如何复制设置。