#epub #ebook #book #convert #parse #structure #content

epubparse

解析 epub 并转换为纯文本的书籍结构

4 个版本

0.2.2 2022年1月16日
0.2.1 2021年5月12日
0.2.0 2021年5月12日
0.1.0 2021年3月29日

1849文本处理

每月下载量 24

MIT 许可证

39KB
845

Epubparse-rs

⚠️ 进行中

需要 Rust 1.56 编译

此库旨在将 Epub 文件转换为纯文本的书籍结构,可用于对包含的文本进行分析。它同时以 Rust crate 的形式发布到 crates.io,以及作为 NPM 包(ESM 模块)发布到 npm。有关所有组件,请参阅 项目仓库

设计目标

  • ✅ 作为 epubparse-wasm 库的核心(必须编译为 WASM)
  • ✅ 合理地将书籍转换为具有章节的书籍
  • ✅ 支持 Epub 版本 2 目录 (.ncx)
  • ❌ 不支持 Epub 版本 3 目录 (.xhtml)(尚未实现,但许多版本 3 的 epub 也包含版本 2 的目录,这些也应该可以工作)
    ❌ 不支持 Epub 版本 3 目录 (.xhtml)(尚未实现,但许多版本 3 的 epub 也包含版本 2 的目录,这些也应该可以工作)

lib.rs:

一个用于解析 epub 文件的库

设计目标

  • ✅ 作为 epubparse-wasm 库的核心(必须编译为 WASM)
  • ✅ 合理地将书籍转换为具有章节的书籍
  • ✅ 支持 Epub 版本 2 目录 (.ncx)
  • ❌ 不支持 Epub 版本 3 目录 (.xhtml)(尚未实现,但许多版本 3 的 epub 也包含版本 2 的目录,这些也应该可以工作)

依赖关系

~3.5–5.5MB
~99K SLoC