5 个稳定版本
2.0.2 | 2024年2月6日 |
---|---|
2.0.0 | 2023年11月24日 |
1.1.0 | 2022年8月5日 |
1.0.1 | 2022年5月12日 |
0.9.0 |
|
#201 在 硬件支持
30MB
605 行
包含 (Windows DLL,410KB) data/lib/windows/amd64/libpv_cheetah.dll,(ELF 库,270KB) libpv_cheetah.so,(ELF 库,290KB) data/lib/linux/x86_64/libpv_cheetah.so,(Mach-o 库,340KB) data/lib/mac/arm64/libpv_cheetah.dylib,(Mach-o 库,355KB) data/lib/mac/x86_64/libpv_cheetah.dylib,(ELF 库,270KB) libpv_cheetah.so 以及 5 个其他文件。
Rust 的 Cheetah 绑定
Cheetah 语音转文本引擎
由 Picovoice 在加拿大温哥华制作
Cheetah 是一个设备上的流式语音转文本引擎。Cheetah 是
- 私有;所有语音处理都在本地运行。
- 准确
- 紧凑且计算效率高
- 跨平台
- Linux (x86_64),macOS (x86_64, arm64),和 Windows (x86_64)
- Android 和 iOS
- Chrome,Safari,Firefox 和 Edge
- 树莓派 (5, 4, 3) 和 NVIDIA Jetson Nano
兼容性
- Rust 1.54+
- 在 Linux (x86_64),macOS (x86_64, arm64),Windows (x86_64),树莓派 (5, 4, 3),和 NVIDIA Jetson Nano 上运行。
安装
首先您需要在您的系统上安装 Rust 和 Cargo。
要将 Cheetah 库添加到您的应用中,请将 pv_cheetah
添加到您的应用的 Cargo.toml
清单中
[dependencies]
pv_cheetah = "*"
如果您希望克隆仓库并本地使用,首先运行 copy.sh
。 (注意:在 Windows 上,需要 Git Bash 或其他 bash shell,否则您需要手动将库复制到项目中)。然后您可以引用本地绑定位置
[dependencies]
pv_cheetah = { path = "/path/to/rust/binding" }
访问密钥
Cheetah 在初始化时需要有效的 Picovoice AccessKey
。当使用 Cheetah SDK 时,AccessKey
作为您的凭据。您可以免费获取 AccessKey
。请确保您的 AccessKey
保密。在 Picovoice 控制台 注册或登录以获取 AccessKey
。
用法
创建引擎实例并转录音频
use cheetah::CheetahBuilder;
fn next_audio_frame() -> Vec<i16> {
// get audio frame
}
let access_key = "${ACCESS_KEY}"; // AccessKey obtained from Picovoice Console (https://console.picovoice.ai/)
let cheetah: Cheetah = CheetahBuilder::new().access_key(access_key).init().expect("Unable to create Cheetah");
if let Ok(cheetahTranscript) = cheetah.process(&next_audio_frame()) {
println!("{}", cheetahTranscript.transcript)
if cheetahTranscript.is_endpoint {
if let Ok(cheetahTranscript) = cheetah.flush() {
println!("{}", cheetahTranscript.transcript)
}
}
}
将 ${ACCESS_KEY}
替换为您从 Picovoice 控制台 获得的内容。
模型文件包含 Cheetah 引擎的参数。您可以使用 Picovoice 控制台 创建定制语言模型,然后将相关文件传递进去。
示例
Cheetah Rust 示例项目 是一个 Rust 控制台应用程序,允许使用 Cheetah 处理实时音频(例如麦克风)和文件。