5 个不稳定版本
0.3.0 | 2022 年 4 月 17 日 |
---|---|
0.1.2 | 2020 年 2 月 29 日 |
0.1.1 | 2020 年 2 月 29 日 |
0.1.0 | 2020 年 2 月 29 日 |
0.0.0 | 2020 年 2 月 26 日 |
#687 in 文件系统
用于 alass-ffi
660KB
784 行
alass-util
Alass-core 与字幕同步的 Rust 便捷 API
alass-core
是一个功能强大的库,能够快速准确地执行字幕同步。 alass-util
是一个包装库,提供了各种功能,使将字幕同步集成到 Rust 程序中更加容易。这些功能包括
- 加载和保存字幕文件
- 使用
webrtc-vad
crate 处理音频以检测语音活动 - 将语音活动转换为参考时间间隔
- 自动检测字幕字符集
- 将参考时间间隔保存到磁盘或从磁盘加载
- 实验性支持自动帧率校正
- 实验性支持“清洁”语音活动数据
此 crate 不提供的内容
- 从媒体文件中提取和重采样音频流的工具
文档
有关 API 详细信息,请参阅 docs.rs。
语音活动检测器
此 crate 提供两种语音活动检测选项
- WebRTC VAD:此 crate 默认使用的检测器。速度快,但结果质量较低。请参阅
vad-webrtc
Cargo 功能。 - Silero:具有更好的结果但处理时间较长的 LSTM 模型。请根据您选择的 ONNX 运行时查看
vad-silero-tract
或vad-silero-onnx runtime
。
FFI
不使用 Rust?请参阅 alass-ffi
的配套 crate 以获取 C 绑定。
许可证
除非另有说明,此仓库中的所有内容均受 GPL-3.0 许可证保护
依赖项
~22–34MB
~449K SLoC