#语音识别 #谷歌 #语音

google-cognitive-apis-custom

封装Google语音识别、语音合成和Dialogflow API的库。提供高级API层,封装了GRPC底层复杂度。

1个不稳定版本

0.1.0 2024年8月13日

#645 in 音频

Download history 175/week @ 2024-08-10

每月175次下载

MIT/Apache

1.5MB
23K SLoC

Rust 18K SLoC // 0.0% comments Bazel 4.5K SLoC // 0.1% comments

Google认知API


CI License License: MIT Crates.io rustdoc

异步Rust绑定,用于Google Cloud Platform认知gRPC API。提供高级接口,封装了底层GRPC实现的复杂性。支持双向gRPC流,采用两种不同的方法

以下API目前受支持

认知API 功能名称 状态
Dialogflow ES dialogflow 完成
语音识别 speech-to-text 完成
语音合成 text-to-speech 完成

重要:0.2.0版本正在升级底层GRPC栈(tonicprostprost-build库)。请注意,现在prost-build需要外部协议缓冲编译器(protoc)。详细信息请参阅此处。您可以从GitHub下载protoc。

Google API协议定义

Google协议定义已从存储库中提取。

限制

  • 仅支持Google认知API的有限子集。欢迎提交PR添加新功能!
  • Dialogflow CX目前不受支持。
  • 对于Dialogflow,我们目前仅支持SessionClient(此库的目的不是支持不同的DialogFlow管理API)。
  • REST API仅支持单一目的:定义结构体,以便将JSON配置结构体反序列化,并将其转换为GRPC对应项。不会引入对REST API的完整支持。

示例

您可以在此处找到所有示例。

许可证

Apache-2.0或MIT许可证。

依赖关系

~20–33MB
~610K SLoC