2个不稳定版本
0.2.0 | 2024年7月2日 |
---|---|
0.1.1 |
|
0.1.0 | 2024年4月20日 |
#337 在 数据库实现
94 每月下载量
42KB
765 行
Arroyo Cloud | 入门 | 文档 | Discord | 网站
Arroyo 是一个用Rust编写的分布式流处理引擎,旨在高效地对数据流执行有状态的计算。与传统批处理不同,流式处理引擎可以在有界和无界源上运行,一旦结果可用即发出。
简而言之:Arroyo可以让您用亚秒级的结果对高容量实时数据进行复杂查询。
功能
🦀 SQL和Rust管道
🚀 每秒可扩展至数百万个事件
🪟 窗口和连接等有状态操作
🔥 管道故障容错和恢复的检查点状态
🕒 通过数据流模型进行及时流处理
用例
一些示例用例包括
- 检测欺诈和安全事件
- 实时产品和业务分析
- 实时数据仓库或数据湖的实时摄入
- 实时ML特征生成
为什么选择Arroyo
已经有几个现成的流式处理引擎,包括 Apache Flink,Spark Streaming 和 Kafka Streams。为什么创建一个新的呢?
- 无服务器操作:Arroyo管道旨在在现代云环境中运行,支持无缝扩展、恢复和重新调度
- 高性能SQL:SQL是第一类关注点,具有始终如一的卓越性能
- 面向非专业人士设计:Arroyo将管道API与其内部实现清晰分离。您不需要成为流式处理专家就能构建实时数据管道。
入门
您可以通过运行以下Docker命令开始使用单个节点Arroyo集群:
$ docker run -p 8000:8000 ghcr.io/arroyosystems/arroyo-single:latest
或者如果您已安装Cargo,可以使用arroyo
命令行界面
$ cargo install arroyo
$ arroyo start
然后,在https://127.0.0.1:8000加载Web UI。
对于更深入的指南,请参阅入门指南。
一旦Arroyo启动,请按照教程来创建您的第一个实时管道。
开发Arroyo
我们欢迎社区的贡献!查看开发者设置指南以开始,并在discord上联系团队或创建一个问题。
社区
Arroyo Cloud
不想自托管?Arroyo Systems为Arroyo提供完全托管的云托管服务。在此注册。
依赖项
~15–24MB
~343K SLoC