2个不稳定版本

0.2.0 2024年7月2日
0.1.1 2024年6月26日
0.1.0 2024年4月20日

#337数据库实现

Download history 32/week @ 2024-04-22 25/week @ 2024-04-29 29/week @ 2024-05-06 23/week @ 2024-05-13 27/week @ 2024-05-20 9/week @ 2024-05-27 30/week @ 2024-06-03 31/week @ 2024-06-10 20/week @ 2024-06-17 173/week @ 2024-06-24 214/week @ 2024-07-01 67/week @ 2024-07-08 14/week @ 2024-07-15 36/week @ 2024-07-22 27/week @ 2024-07-29 15/week @ 2024-08-05

94 每月下载量

MIT/Apache

42KB
765

Arroyo

Arroyo Cloud | 入门 | 文档 | Discord | 网站

Arroyo is dual-licensed under Apache 2 and MIT licenses. PRs welcome! git commit activity CI GitHub release (latest by date)

Arroyo 是一个用Rust编写的分布式流处理引擎,旨在高效地对数据流执行有状态的计算。与传统批处理不同,流式处理引擎可以在有界和无界源上运行,一旦结果可用即发出。

简而言之:Arroyo可以让您用亚秒级的结果对高容量实时数据进行复杂查询。

running job

功能

🦀 SQL和Rust管道

🚀 每秒可扩展至数百万个事件

🪟 窗口和连接等有状态操作

🔥 管道故障容错和恢复的检查点状态

🕒 通过数据流模型进行及时流处理

用例

一些示例用例包括

  • 检测欺诈和安全事件
  • 实时产品和业务分析
  • 实时数据仓库或数据湖的实时摄入
  • 实时ML特征生成

为什么选择Arroyo

已经有几个现成的流式处理引擎,包括 Apache FlinkSpark StreamingKafka Streams。为什么创建一个新的呢?

  • 无服务器操作:Arroyo管道旨在在现代云环境中运行,支持无缝扩展、恢复和重新调度
  • 高性能SQL:SQL是第一类关注点,具有始终如一的卓越性能
  • 面向非专业人士设计:Arroyo将管道API与其内部实现清晰分离。您不需要成为流式处理专家就能构建实时数据管道。

入门

您可以通过运行以下Docker命令开始使用单个节点Arroyo集群:

$ docker run -p 8000:8000 ghcr.io/arroyosystems/arroyo-single:latest

或者如果您已安装Cargo,可以使用arroyo命令行界面

$ cargo install arroyo
$ arroyo start

然后,在https://127.0.0.1:8000加载Web UI。

对于更深入的指南,请参阅入门指南

一旦Arroyo启动,请按照教程来创建您的第一个实时管道。

开发Arroyo

我们欢迎社区的贡献!查看开发者设置指南以开始,并在discord上联系团队或创建一个问题。

社区

Arroyo Cloud

不想自托管?Arroyo Systems为Arroyo提供完全托管的云托管服务。在此注册

依赖项

~15–24MB
~343K SLoC