5个版本 (2个稳定版)

1.0.1	2022年3月22日
1.0.0	2022年3月5日
0.1.3	2021年5月31日

在音频中排名第 769

每月下载量 24

MIT许可

18KB
239 行

ds-transcriber

DeepSpeech驱动的工具，用于获取麦克风流转录

前言

您可以将此crate视为RustAudio的deepspeech-rs的包装器。它旨在为麦克风流提供转录（可选降噪），请参阅下面的cargo-features。

入门指南

此示例展示了开始使用ds-transcriber的最快方式。首先，将ds-transcriber添加到您的Cargo.toml

ds-transcriber = "1"

下载DeepSpeech 原生客户端，然后将其目录添加到您的LD_LIBRARY_PATH和LIBRARY_PATH变量中。

请参阅StreamSettings以微调转录流，使其更适合您的环境

let mut model = ds_transcriber::model::instance_model(
    "model_file.pbmm",
    Some("scorer_file.scorer"),
)?;
let config = ds_transcriber::StreamSettings::default();
let i_said = ds_transcriber::transcribe(config, &mut model)?;
println!("I said: {}", i_said);

重复最后两行

Cargo功能

此crate提供了可选的音频流降噪功能（可能有助于提高转录质量）。默认情况下是禁用的，要启用它：使用crate功能列表中的denoise或full键。

ds-transcriber = { version = "1", features = ["denoise"] } # or features = ["full"]

额外内容

此crate包含一个示例，帮助您入门。克隆存储库并运行它

有关参数的帮助，请运行

cargo run --example transcribe -- -h

要启动示例，请运行

cargo run --example transcribe -- -m model_path -c deepspeech_native_client_dir

可以提供一个可选的（但建议）语言模型（评分器）路径，使用-s或--scorer

重新导出

如果启用了denoise功能，此crate还重新导出deepspeech和nnnoiseless crate（您可以使用这些重新导出而不是单独依赖它们）。

转录提示

仅下载DeepSpeech模型，根据您的口音，最多只能得到及格的结果。如果您想显著提高结果，您可能还需要下载一个语言模型/评分器。它有助于以下情况：例如 我昨晚读了一本书 与 我昨晚red了一本书 的比较。只需将评分器放在与您的模型相同的目录中。当您创建 ds_transcriber::model::DeepSpeechModel

如果您想训练自己的模型，为了获得最佳结果，请查看Mimic Recording Studio，它提供了阅读提示，并自动为您准备好与相应转录的音频文件，以便您用于微调

贡献

始终欢迎！如果您有想法，请打开一个问题或PR。

依赖项

~1–6MB
~113K SLoC