5个版本 (2个稳定版)
1.0.1 | 2022年3月22日 |
---|---|
1.0.0 | 2022年3月5日 |
0.1.3 | 2021年5月31日 |
在 音频 中排名第 769
每月下载量 24
18KB
239 行
ds-transcriber
DeepSpeech驱动的工具,用于获取麦克风流转录
前言
您可以将此crate视为RustAudio的deepspeech-rs的包装器。它旨在为麦克风流提供转录(可选降噪),请参阅下面的cargo-features
。
入门指南
此示例展示了开始使用ds-transcriber的最快方式。首先,将ds-transcriber
添加到您的Cargo.toml
ds-transcriber = "1"
下载DeepSpeech 原生客户端,然后将其目录添加到您的LD_LIBRARY_PATH
和LIBRARY_PATH
变量中。
请参阅StreamSettings以微调转录流,使其更适合您的环境
let mut model = ds_transcriber::model::instance_model(
"model_file.pbmm",
Some("scorer_file.scorer"),
)?;
let config = ds_transcriber::StreamSettings::default();
let i_said = ds_transcriber::transcribe(config, &mut model)?;
println!("I said: {}", i_said);
重复最后两行
Cargo功能
此crate提供了可选的音频流降噪功能(可能有助于提高转录质量)。默认情况下是禁用的,要启用它:使用crate功能列表中的denoise
或full
键。
ds-transcriber = { version = "1", features = ["denoise"] } # or features = ["full"]
额外内容
此crate包含一个示例,帮助您入门。克隆存储库并运行它
有关参数的帮助,请运行
cargo run --example transcribe -- -h
要启动示例,请运行
cargo run --example transcribe -- -m model_path -c deepspeech_native_client_dir
可以提供一个可选的(但建议)语言模型(评分器)路径,使用-s
或--scorer
重新导出
如果启用了denoise
功能,此crate还重新导出deepspeech
和nnnoiseless
crate(您可以使用这些重新导出而不是单独依赖它们)。
转录提示
仅下载DeepSpeech模型,根据您的口音,最多只能得到及格的结果。如果您想显著提高结果,您可能还需要下载一个语言模型/评分器。它有助于以下情况:例如 我昨晚读了一本书
与 我昨晚red了一本书
的比较。只需将评分器放在与您的模型相同的目录中。当您创建 ds_transcriber::model::DeepSpeechModel
如果您想训练自己的模型,为了获得最佳结果,请查看Mimic Recording Studio,它提供了阅读提示,并自动为您准备好与相应转录的音频文件,以便您用于微调
贡献
始终欢迎!如果您有想法,请打开一个问题或PR。
依赖项
~1–6MB
~113K SLoC