#语音识别 #语音转文本 #封装器 #元数据 #模型 #coqui

coqui-stt

Coqui STT C库的安全封装

12个版本 (3个稳定版)

1.0.2 2022年7月4日
0.3.3 2022年6月5日
0.3.2 2022年5月31日
0.3.0 2022年4月30日
0.1.0 2022年2月3日

#356音频

Download history 25/week @ 2024-03-11 16/week @ 2024-03-18 34/week @ 2024-04-01 7/week @ 2024-04-08 12/week @ 2024-04-15 17/week @ 2024-04-22 11/week @ 2024-04-29 9/week @ 2024-05-06 14/week @ 2024-05-13 9/week @ 2024-05-20 13/week @ 2024-05-27 12/week @ 2024-06-03 10/week @ 2024-06-10 14/week @ 2024-06-17 13/week @ 2024-06-24

每月51次下载

MPL-2.0 许可证

45KB
740 代码行

coqui-stt

文档: https://docs.rs/coqui-stt/latest/coqui_stt

crates.io: https://crates.io/crates/coqui-stt

Github: https://github.com/tazz4843/coqui-stt

这是一个简单的、功能丰富的coqui-stt C API的封装。

为你处理所有底层事情。你只需要关注传递一个有效的模型、可选的评分器和音频。

如果你愿意,可以使用Stream类支持音频流。

你可以使用Metadata类获取音频结果的扩展元数据。

一些隐藏函数也通过Rust API中的#[doc(hidden)]公开。

在Windows上

编译你的代码

Coqui-STT C库需要被rust链接器发现。为此,你可以执行以下操作之一

  • 将它们移动到你的PATH变量中的一个文件夹。
  • 创建一个构建脚本,并向cargo提供库的路径,使用cargo:rustc-link-searchcargo:rustc-link-lib

运行你的代码

库也必须可由可执行文件发现。如果您遵循了上一节中的第一个选项,它将无需额外努力即可运行;否则,您需要将库复制到当前工作目录(默认情况下为target/<profile name>)。建议您使用cargo-make等工具来自动化此过程。

在Linux上

编译你的代码

至于Windows,库需要可由Rust链接器发现。您有几个选项

  • 将它们移动到/usr/local/lib/usr/lib。如果您有root权限,并计划在构建同一台机器上运行可执行文件,这是推荐的方法。
  • 在构建过程中,将环境变量LIBRARY_PATH设置为未压缩的libstt.tflite.Linux.zip文件的路径。这需要在执行期间设置相应的环境变量。

运行你的代码

与Windows类似,库需要可由可执行文件发现。无法进行静态链接。

  • 如果您遵循了上面的选项1,只要库保持在安装目录中,就应该能够在没有问题的情况下运行可执行文件。
  • 如果您遵循了上面的选项2,您需要将环境变量LD_LIBRARY_PATH设置为未压缩的libstt.tflite.Linux.zip文件的目录。只要LD_LIBRARY_PATH设置为正确的位置,库不需要与构建时相同的位置。

MSRV

MSRV总是最新稳定的版本,截至本文撰写时为1.58.1(2022-01-20)。

依赖关系

~0–1MB
~20K SLoC