#pcm #silk

sys silk-v3-sys

Rust对silk v3的绑定

1 个不稳定版本

0.1.0 2023年5月4日

25#pcm

MIT 许可证

1MB
17K SLoC

C 13K SLoC // 0.3% comments GNU Style Assembly 4K SLoC // 0.1% comments Rust 44 SLoC

Silk V3 解码器

介绍和说明

SILK是一种由Skype公司研发的语音编码格式,最后的版本发布时间为2012年。

SILK 原始代码已上传至 发布 ,包含规范文档

SILK编码格式与腾讯语音的关系

  1. 标准silk文件以b'#!SILK_V3'开始,以b'\xFF\xFF'结束,中间为语音数据。
  2. 微信语音文件在标准SILK文件的开头插入了b'\x02',去除了结尾的 b'\xFF\xFF',中间不变。

语音数据

语音数据分为很多个独立的 frame ,每个 frame 开头两字节存储剩余 frame 数据的大小,每个 frame 默认存储 20ms 的音频数据,

据此可通过程序计算出 语音文件 持续时间(duration) 的函数。

SILK格式规范,frame_ms 可分为20、40、60、80、100

依赖

~0.2–2.3MB
~45K SLoC