#transcription #microphone #speech-to-text #record #audio-stream #speech-detection

ds-transcriber

一个使用DeepSpeech绑定的crate,将麦克风音频转换为文本

5个版本 (2个稳定版)

1.0.1 2022年3月22日
1.0.0 2022年3月5日
0.1.3 2021年5月31日

音频 中排名第 769

每月下载量 24

MIT许可

18KB
239

ds-transcriber

GitHub Crates.io docs.rs

DeepSpeech驱动的工具,用于获取麦克风流转录

前言

您可以将此crate视为RustAudio的deepspeech-rs的包装器。它旨在为麦克风流提供转录(可选降噪),请参阅下面的cargo-features

入门指南

此示例展示了开始使用ds-transcriber的最快方式。首先,将ds-transcriber添加到您的Cargo.toml

ds-transcriber = "1"

下载DeepSpeech 原生客户端,然后将其目录添加到您的LD_LIBRARY_PATHLIBRARY_PATH变量中。

请参阅StreamSettings以微调转录流,使其更适合您的环境

let mut model = ds_transcriber::model::instance_model(
    "model_file.pbmm",
    Some("scorer_file.scorer"),
)?;
let config = ds_transcriber::StreamSettings::default();
let i_said = ds_transcriber::transcribe(config, &mut model)?;
println!("I said: {}", i_said);

重复最后两行

Cargo功能

此crate提供了可选的音频流降噪功能(可能有助于提高转录质量)。默认情况下是禁用的,要启用它:使用crate功能列表中的denoisefull键。

ds-transcriber = { version = "1", features = ["denoise"] } # or features = ["full"]

额外内容

此crate包含一个示例,帮助您入门。克隆存储库并运行它

有关参数的帮助,请运行

cargo run --example transcribe -- -h

要启动示例,请运行

cargo run --example transcribe -- -m model_path -c deepspeech_native_client_dir

可以提供一个可选的(但建议)语言模型(评分器)路径,使用-s--scorer

重新导出

如果启用了denoise功能,此crate还重新导出deepspeechnnnoiseless crate(您可以使用这些重新导出而不是单独依赖它们)。

转录提示

仅下载DeepSpeech模型,根据您的口音,最多只能得到及格的结果。如果您想显著提高结果,您可能还需要下载一个语言模型/评分器。它有助于以下情况:例如 我昨晚读了一本书我昨晚red了一本书 的比较。只需将评分器放在与您的模型相同的目录中。当您创建 ds_transcriber::model::DeepSpeechModel

如果您想训练自己的模型,为了获得最佳结果,请查看Mimic Recording Studio,它提供了阅读提示,并自动为您准备好与相应转录的音频文件,以便您用于微调

贡献

始终欢迎!如果您有想法,请打开一个问题或PR。

依赖项

~1–6MB
~113K SLoC