16个版本 (10个重大更新)

0.11.1 2024年4月6日
0.10.0 2023年11月27日
0.8.0 2023年5月14日
0.5.0 2023年3月27日
0.2.0 2022年10月29日

#20 in 机器学习

Download history 535/week @ 2024-04-25 259/week @ 2024-05-02 196/week @ 2024-05-09 256/week @ 2024-05-16 266/week @ 2024-05-23 314/week @ 2024-05-30 250/week @ 2024-06-06 305/week @ 2024-06-13 252/week @ 2024-06-20 197/week @ 2024-06-27 244/week @ 2024-07-04 167/week @ 2024-07-11 177/week @ 2024-07-18 285/week @ 2024-07-25 326/week @ 2024-08-01 260/week @ 2024-08-08

每月 1,075 次下载
7 crates (5直接) 中使用

无许可证

2.5MB
50K SLoC

C 22K SLoC // 0.1% comments CUDA 8K SLoC // 0.0% comments Rust 7K SLoC // 0.0% comments C++ 6K SLoC // 0.1% comments Metal Shading Language 4.5K SLoC // 0.0% comments Objective-C 2.5K SLoC // 0.1% comments Objective-C++ 51 SLoC // 0.0% comments

whisper-rs

Rust绑定到whisper.cpp

用法

git clone --recursive https://github.com/tazz4843/whisper-rs.git

cd whisper-rs

cargo run --example basic_use

cargo run --example audio_transcription
use whisper_rs::{WhisperContext, WhisperContextParameters, FullParams, SamplingStrategy};

fn main() {
	let path_to_model = std::env::args().nth(1).unwrap();

	// load a context and model
	let ctx = WhisperContext::new_with_params(
		path_to_model,
		WhisperContextParameters::default()
	).expect("failed to load model");

	// create a params object
	let params = FullParams::new(SamplingStrategy::Greedy { best_of: 1 });

	// assume we have a buffer of audio data
	// here we'll make a fake one, floating point samples, 32 bit, 16KHz, mono
	let audio_data = vec![0_f32; 16000 * 2];

	// now we can run the model
	let mut state = ctx.create_state().expect("failed to create state");
	state
		.full(params, &audio_data[..])
		.expect("failed to run model");

	// fetch the results
	let num_segments = state
		.full_n_segments()
		.expect("failed to get number of segments");
	for i in 0..num_segments {
		let segment = state
			.full_get_segment_text(i)
			.expect("failed to get segment");
		let start_timestamp = state
			.full_get_segment_t0(i)
			.expect("failed to get segment start timestamp");
		let end_timestamp = state
			.full_get_segment_t1(i)
			.expect("failed to get segment end timestamp");
		println!("[{} - {}]: {}", start_timestamp, end_timestamp, segment);
	}
}

有关详细信息,请参阅examples/basic_use.rs

如果需要,则公开低级别绑定,但对于大多数用例,上面的内容应该足够。有关更多详细信息,请参阅https://docs.rs/whisper-rs/

功能标志

默认情况下全部禁用,除非另有说明。

  • raw-api:无需将whisper-rs-sys作为依赖项拉入即可公开whisper-rs-sys。**注意**:启用此功能不再保证semver兼容性,因为whisper-rs-sys可能在whisper-rs的补丁版本中升级到破坏性版本。
  • cuda:启用CUDA支持。隐式启用运行时隐藏的GPU标志。
  • opencl:启用OpenCL支持。上游whisper.cpp不将OpenCL视为GPU,因此在运行时始终启用。
  • openblas:启用OpenBLAS支持。
  • metal:启用Metal支持。隐式启用运行时隐藏的GPU标志。
  • whisper-cpp-log:允许将whisper.cpp的日志输出挂钩到log后端。需要调用
  • whisper-cpp-tracing:允许将whisper.cpp的日志输出挂钩到tracing后端。

构建

有关在Windows和OSX M1上构建whisper-rs的说明,请参阅BUILDING.md。Linux构建应该直接工作。

故障排除

  • 除了Windows/macOS/Linux之外的某些内容不起作用!
    • 我没有测试这些平台的方法,因此我无法真正帮助您。
      • 如果您能让它工作,请打开一个PR,包含使其工作的任何更改和BUILDING.md中的构建说明!
  • 在绑定生成构建过程中我遇到了恐慌!
    • 您可以尝试自己修复它,或者可以设置WHISPER_DONT_GENERATE_BINDINGS环境变量。这将跳过尝试构建绑定,并复制现有的绑定。它们可能已经过时,但总比没有好。
      • WHISPER_DONT_GENERATE_BINDINGS=1cargo build
    • 如果您能修复这个问题,请打开一个PR!

许可证

无许可证

tl;dr: 公共领域

依赖项

~0–2.2MB
~42K SLoC