2 个不稳定版本
0.2.0 | 2024年7月2日 |
---|---|
0.1.1 |
|
0.1.0 | 2024年4月20日 |
#273 in 数据库实现
101 每月下载量
用于 2 crates
28KB
555 代码行
Arroyo 云 | 入门 | 文档 | Discord | 网站
Arroyo 是一个用 Rust 编写的分布式流处理引擎,旨在高效地对数据流执行状态计算。与传统批量处理不同,流式引擎可以处理有界和无界的数据源,并在结果可用时立即发出。
简而言之:Arroyo 允许您以亚秒级的结果对高容量实时数据进行复杂查询。
特性
🦀 SQL 和 Rust 管道
🚀 每秒处理百万级事件
🪟 窗口和连接等状态操作
🔥 对管道进行状态检查点以实现容错和恢复
🕒 通过 数据流模型 进行及时流处理
用例
一些示例用例包括
- 检测欺诈和安全事件
- 实时产品和企业分析
- 实时数据仓库或数据湖的摄入
- 实时机器学习特征生成
为什么选择 Arroyo
已经存在许多现有的流式引擎,包括 Apache Flink,Spark Streaming 和 Kafka Streams。为什么还要创建一个新的呢?
- 无服务器操作:Arroyo 管道旨在在现代云环境中运行,支持无缝扩展、恢复和重新安排
- 高性能 SQL:SQL 是一等关注点,具有始终如一的优秀性能
- 面向非专业人士设计:Arroyo将管道API与其内部实现干净地分开。您无需成为流专家即可构建实时数据处理管道。
入门指南
您可以通过运行以下Docker命令来启动单个节点的Arroyo集群:
$ docker run -p 8000:8000 ghcr.io/arroyosystems/arroyo-single:latest
或者如果您已安装Cargo,可以使用arroyo
命令行界面。
$ cargo install arroyo
$ arroyo start
然后,在https://127.0.0.1:8000加载Web界面。
要获取更详细的指南,请参阅入门指南。
一旦Arroyo启动,请遵循教程创建您的第一个实时管道。
开发Arroyo
我们欢迎社区的贡献!请参阅开发人员设置指南以开始,并在discord上联系团队或创建一个问题。
社区
Arroyo云
不想自己托管?Arroyo Systems为Arroyo提供完全管理的云托管服务。在此注册。
依赖关系
~14–23MB
~322K SLoC