#openai #whisper #transcribe #serve #openai-api #http-server #speech-recognition

bin+lib whisperd

OpenAI Whisper语音转文本模型的HTTP服务器

2个版本

0.1.12 2023年10月27日
0.1.0 2023年10月26日

#1933 in 命令行工具

MIT 许可证

34KB
876 代码行

whisperd 🎙️

Crates.io Documentation GitHub release

使用Rust编写的简单HTTP服务器,用于OpenAI Whisper语音转文本模型。

特性 ✨

  • 🎧 转录音频文件
  • 🔄 兼容OpenAI API
  • 🌈 模型
    • tiny.en
    • tiny
    • base.en
    • base
    • small.en
    • small
    • medium.en
    • medium
    • large
    • large-v1
  • 🌍 语言
    • 🇬🇧 英语 (en)
    • 🇨🇳 中文 (zh)
    • 🇩🇪 德语 (de)
    • 🇪🇸 西班牙语 (es)
    • 🇷🇺 俄语 (ru)

快速入门 🚀

  1. 克隆此仓库
git clone https://github.com/tiero/whisperd.git
  1. 导航到仓库并构建
cd whisperd
cargo build --release
  1. 运行服务器
./target/release/whisperd serve --model_path path_to_whisper_model

现在,服务器正在 https://127.0.0.1:8000 上运行,准备转录!

用法 🛠️

CLI命令

  • 启动转录服务器
whisperd serve --port 5000 --model_path <path_to_model> 
  • 转录指定的音频文件(这会自动从HuggingFace下载模型)
whisperd transcribe --audio <path_to_audio>

对于更高级的选项,使用

whisperd --help

贡献 🤝

欢迎提交拉取请求和问题!

许可证 📜

本项目采用MIT许可证 - 请参阅LICENSE文件以获取详细信息。

依赖项

~26–46MB
~802K SLoC