1 个不稳定版本
0.1.0 | 2023年5月4日 |
---|
25 在 #pcm
1MB
17K SLoC
Silk V3 解码器
介绍和说明
SILK是一种由Skype公司研发的语音编码格式,最后的版本发布时间为2012年。
SILK 原始代码已上传至 发布 ,包含规范文档
SILK编码格式与腾讯语音的关系
- 标准silk文件以
b'#!SILK_V3'
开始,以b'\xFF\xFF'
结束,中间为语音数据。 - 微信语音文件在标准SILK文件的开头插入了
b'\x02'
,去除了结尾的b'\xFF\xFF'
,中间不变。
语音数据
语音数据分为很多个独立的 frame ,每个 frame 开头两字节存储剩余 frame 数据的大小,每个 frame 默认存储 20ms 的音频数据,
据此可通过程序计算出 语音文件 持续时间(duration) 的函数。
SILK格式规范,frame_ms 可分为20、40、60、80、100
依赖
~0.2–2.3MB
~45K SLoC