16 个版本 (8 个破坏性更新)
0.9.0 | 2024年4月6日 |
---|---|
0.8.0 | 2023年11月27日 |
0.7.2 | 2023年10月8日 |
0.6.1 | 2023年6月18日 |
0.2.0 |
|
在 音频 类别中排名第 291
每月下载 990 次
在 8 个 Crates 中使用(通过 whisper-rs)
2MB
49K SLoC
whisper-rs
Rust 对 whisper.cpp 的绑定
使用方法
git clone --recursive https://github.com/tazz4843/whisper-rs.git
cd whisper-rs
cargo run --example basic_use
cargo run --example audio_transcription
use whisper_rs::{WhisperContext, WhisperContextParameters, FullParams, SamplingStrategy};
fn main() {
let path_to_model = std::env::args().nth(1).unwrap();
// load a context and model
let ctx = WhisperContext::new_with_params(
path_to_model,
WhisperContextParameters::default()
).expect("failed to load model");
// create a params object
let params = FullParams::new(SamplingStrategy::Greedy { best_of: 1 });
// assume we have a buffer of audio data
// here we'll make a fake one, floating point samples, 32 bit, 16KHz, mono
let audio_data = vec![0_f32; 16000 * 2];
// now we can run the model
let mut state = ctx.create_state().expect("failed to create state");
state
.full(params, &audio_data[..])
.expect("failed to run model");
// fetch the results
let num_segments = state
.full_n_segments()
.expect("failed to get number of segments");
for i in 0..num_segments {
let segment = state
.full_get_segment_text(i)
.expect("failed to get segment");
let start_timestamp = state
.full_get_segment_t0(i)
.expect("failed to get segment start timestamp");
let end_timestamp = state
.full_get_segment_t1(i)
.expect("failed to get segment end timestamp");
println!("[{} - {}]: {}", start_timestamp, end_timestamp, segment);
}
}
有关更多详细信息,请参阅 examples/basic_use.rs
如果需要,则公开低级绑定,但上述内容应该足以满足大多数用例。有关更多详细信息,请参阅文档:https://docs.rs/whisper-rs/
功能标志
默认情况下全部禁用,除非另有说明。
raw-api
:无需将其作为依赖项拉入即可公开 whisper-rs-sys。 注意:启用此选项不再保证 semver 兼容性,因为 whisper-rs-sys 可能会在 whisper-rs 的补丁版本中升级到破坏性版本。cuda
:启用 CUDA 支持。隐式地在运行时启用隐藏的 GPU 标志。hipblas
:启用 ROCm/hipBLAS 支持。仅在 Linux 上可用。隐式地在运行时启用隐藏的 GPU 标志。opencl
:启用 OpenCL 支持。上游 whisper.cpp 不将 OpenCL 视为 GPU,因此在运行时始终启用。openblas
:启用 OpenBLAS 支持。metal
:启用 Metal 支持。隐式地在运行时启用隐藏的 GPU 标志。whisper-cpp-log
:允许挂钩 whisper.cpp 的日志输出并将其发送到log
后端。需要调用whisper-cpp-tracing
:允许挂钩 whisper.cpp 的日志输出并将其发送到tracing
后端。
构建
请参阅 BUILDING.md 以获取在 Windows 和 OSX M1 上构建 whisper-rs 的说明。Linux 构建应该直接可用。
故障排除
- 除了 Windows/macOS/Linux 之外的其他系统无法工作!
- 我没有测试这些平台的方法,因此我无法真正帮助您。
- 如果您能使其工作,请提交一个 PR,包括使它工作的任何更改和 BUILDING.md 中的构建说明!
- 我没有测试这些平台的方法,因此我无法真正帮助您。
- 在绑定生成构建期间出现恐慌!
- 您可以尝试自行修复它,或者设置环境变量
WHISPER_DONT_GENERATE_BINDINGS
。这将跳过尝试构建绑定,并复制现有的绑定。它们可能已过时,但这总比没有好。WHISPER_DONT_GENERATE_BINDINGS=1cargo build
- 如果您能修复该问题,请提交一个 PR!
- 您可以尝试自行修复它,或者设置环境变量
许可证
tl;dr: 公共领域
依赖关系
~0–2MB
~41K SLoC