2 个不稳定版本

0.2.0 2024年7月2日
0.1.1 2024年6月26日
0.1.0 2024年4月20日

#273 in 数据库实现

Download history 32/week @ 2024-04-22 31/week @ 2024-04-29 31/week @ 2024-05-06 27/week @ 2024-05-13 40/week @ 2024-05-20 18/week @ 2024-05-27 39/week @ 2024-06-03 37/week @ 2024-06-10 23/week @ 2024-06-17 191/week @ 2024-06-24 230/week @ 2024-07-01 69/week @ 2024-07-08 17/week @ 2024-07-15 36/week @ 2024-07-22 31/week @ 2024-07-29 15/week @ 2024-08-05

101 每月下载量
用于 2 crates

MIT/Apache

28KB
555 代码行

Arroyo

Arroyo 云 | 入门 | 文档 | Discord | 网站

Arroyo is dual-licensed under Apache 2 and MIT licenses. PRs welcome! git commit activity CI GitHub release (latest by date)

Arroyo 是一个用 Rust 编写的分布式流处理引擎,旨在高效地对数据流执行状态计算。与传统批量处理不同,流式引擎可以处理有界和无界的数据源,并在结果可用时立即发出。

简而言之:Arroyo 允许您以亚秒级的结果对高容量实时数据进行复杂查询。

running job

特性

🦀 SQL 和 Rust 管道

🚀 每秒处理百万级事件

🪟 窗口和连接等状态操作

🔥 对管道进行状态检查点以实现容错和恢复

🕒 通过 数据流模型 进行及时流处理

用例

一些示例用例包括

  • 检测欺诈和安全事件
  • 实时产品和企业分析
  • 实时数据仓库或数据湖的摄入
  • 实时机器学习特征生成

为什么选择 Arroyo

已经存在许多现有的流式引擎,包括 Apache FlinkSpark StreamingKafka Streams。为什么还要创建一个新的呢?

  • 无服务器操作:Arroyo 管道旨在在现代云环境中运行,支持无缝扩展、恢复和重新安排
  • 高性能 SQL:SQL 是一等关注点,具有始终如一的优秀性能
  • 面向非专业人士设计:Arroyo将管道API与其内部实现干净地分开。您无需成为流专家即可构建实时数据处理管道。

入门指南

您可以通过运行以下Docker命令来启动单个节点的Arroyo集群:

$ docker run -p 8000:8000 ghcr.io/arroyosystems/arroyo-single:latest

或者如果您已安装Cargo,可以使用arroyo命令行界面。

$ cargo install arroyo
$ arroyo start

然后,在https://127.0.0.1:8000加载Web界面。

要获取更详细的指南,请参阅入门指南

一旦Arroyo启动,请遵循教程创建您的第一个实时管道。

开发Arroyo

我们欢迎社区的贡献!请参阅开发人员设置指南以开始,并在discord上联系团队或创建一个问题。

社区

Arroyo云

不想自己托管?Arroyo Systems为Arroyo提供完全管理的云托管服务。在此注册

依赖关系

~14–23MB
~322K SLoC