5 个稳定版本

2.0.2 2024年2月6日
2.0.0 2023年11月24日
1.1.0 2022年8月5日
1.0.1 2022年5月12日
0.9.0 2022年3月19日

#201硬件支持

Apache-2.0

30MB
605

包含 (Windows DLL,410KB) data/lib/windows/amd64/libpv_cheetah.dll,(ELF 库,270KB) libpv_cheetah.so,(ELF 库,290KB) data/lib/linux/x86_64/libpv_cheetah.so,(Mach-o 库,340KB) data/lib/mac/arm64/libpv_cheetah.dylib,(Mach-o 库,355KB) data/lib/mac/x86_64/libpv_cheetah.dylib,(ELF 库,270KB) libpv_cheetah.so 以及 5 个其他文件。

Rust 的 Cheetah 绑定

Cheetah 语音转文本引擎

Picovoice 在加拿大温哥华制作

Cheetah 是一个设备上的流式语音转文本引擎。Cheetah 是

  • 私有;所有语音处理都在本地运行。
  • 准确
  • 紧凑且计算效率高
  • 跨平台
    • Linux (x86_64),macOS (x86_64, arm64),和 Windows (x86_64)
    • Android 和 iOS
    • Chrome,Safari,Firefox 和 Edge
    • 树莓派 (5, 4, 3) 和 NVIDIA Jetson Nano

兼容性

  • Rust 1.54+
  • 在 Linux (x86_64),macOS (x86_64, arm64),Windows (x86_64),树莓派 (5, 4, 3),和 NVIDIA Jetson Nano 上运行。

安装

首先您需要在您的系统上安装 Rust 和 Cargo

要将 Cheetah 库添加到您的应用中,请将 pv_cheetah 添加到您的应用的 Cargo.toml 清单中

[dependencies]
pv_cheetah = "*"

如果您希望克隆仓库并本地使用,首先运行 copy.sh。 (注意:在 Windows 上,需要 Git Bash 或其他 bash shell,否则您需要手动将库复制到项目中)。然后您可以引用本地绑定位置

[dependencies]
pv_cheetah = { path = "/path/to/rust/binding" }

访问密钥

Cheetah 在初始化时需要有效的 Picovoice AccessKey。当使用 Cheetah SDK 时,AccessKey 作为您的凭据。您可以免费获取 AccessKey。请确保您的 AccessKey 保密。在 Picovoice 控制台 注册或登录以获取 AccessKey

用法

创建引擎实例并转录音频

use cheetah::CheetahBuilder;

fn next_audio_frame() -> Vec<i16> {
  // get audio frame
}

let access_key = "${ACCESS_KEY}"; // AccessKey obtained from Picovoice Console (https://console.picovoice.ai/)
let cheetah: Cheetah = CheetahBuilder::new().access_key(access_key).init().expect("Unable to create Cheetah");

if let Ok(cheetahTranscript) = cheetah.process(&next_audio_frame()) {
  println!("{}", cheetahTranscript.transcript)
  if cheetahTranscript.is_endpoint {
    if let Ok(cheetahTranscript) = cheetah.flush() {
      println!("{}", cheetahTranscript.transcript)
    }
  }
}

${ACCESS_KEY} 替换为您从 Picovoice 控制台 获得的内容。

模型文件包含 Cheetah 引擎的参数。您可以使用 Picovoice 控制台 创建定制语言模型,然后将相关文件传递进去。

示例

Cheetah Rust 示例项目 是一个 Rust 控制台应用程序,允许使用 Cheetah 处理实时音频(例如麦克风)和文件。

依赖项