大数数据

  1. aws-sdk-emrcontainers

    AWS SDK for Amazon EMR Containers

    v1.43.0 470 #aws-sdk #big-data #amazon #emr #run #eks #endpoint
  2. datafusion-substrait

    DataFusion Substrait 生成器和消费者

    v41.0.0 5.5K #data-fusion #producer-consumer #substrait #apache-arrow #big-data #plan #query-engine
  3. ballista

    分布式计算

    v0.12.0 #apache-arrow #distributed #scheduler #query-engine #data-fusion #data-processing #big-data
  4. nektar

    Hive Metastore 的快速、轻量级 CLI

    v0.0.7 410 #hive #metastore #command-line-interface #big-data #table #engine #apache
  5. keyvi

    键值索引。它是一种基于内存的 FST 数据结构,在大小和查找性能方面高度优化。

    v0.5.6 750 #key-value-store #fst #search #big-data #string-matching #fuzzy-string #data-structures
  6. wimbd

    用于检查和分析大型文本数据集的 CLI

    v0.3.0 320 #dataset #numbers #cli #ngrams #analyzing #data-processing #big-data
  7. ballista-executor

    Ballista 分布式计算 - 执行器

    v0.12.0 #apache-arrow #distributed #query-engine #ballista #big-data #executor #compute
  8. probabilistic-collections

    各种集合实现,使用近似来提高运行时间或内存,但引入了一定的错误

    v0.7.0 3.5K #collection #probabilistic #data-structures #collections #big-data
  9. ballista-cli

    Ballista 分布式查询引擎的命令行客户端

    v0.12.0 #query-engine #ballista #cli #distributed #sql-query #big-data #apache-arrow
  10. alicedb

    大数据数据库

    v0.1.2 #大数据 #数据库 #GitHub
  11. ballista-scheduler

    Ballista 分布式计算 - 调度器

    v0.12.0 #调度器 #分布式 #ballista #Apache Arrow #大数据 #计算 #查询引擎
  12. avrow

    快速、类型安全的基于 serde 的数据序列化库

    v0.2.1 #avro #大数据 #数据流 #json-schema #json格式 #编码 #数据文件
  13. griddb

    客户端

    v0.6.0 #物联网 #时间序列 #大数据 #数据库
  14. big_data

    创建用于存储大数据的 Erlang NIF 的安全 Rust 代码

    v0.1.2 #big #erlang #nif #store #range #time #row
  15. quickwit-cluster

    Quickwit 的集群成员

    v0.3.0 #集群 #quickwit #membership #云存储 #云原生 #大数据 #分布式跟踪
  16. quickwit-common

    quickwit 的实用工具库

    v0.3.0 #搜索引擎 #大数据 #云原生 #quickwit #分布式跟踪 #存储 #日志
  17. ballista-core

    Ballista 分布式计算

    v0.12.0 #分布式 #ballista #计算 #查询 #Arrow #Apache Arrow #大数据
  18. quickwit-proto

    Quickwit 的 proto

    v0.3.0 #搜索引擎 #quickwit #大数据 #云原生 #proto #存储 #tantivy
  19. 使用 DuckDuckGo 进行搜索

  20. pachyderm

    Pachyderm 的官方 Rust 库

    v0.4.1 #分析 #kubernetes #大数据 #数据科学 #API 绑定
  21. quickwit-aws

    与 AWS 一起工作

    v0.3.0 #aws #云存储 #日志 #云原生 #大数据 #分布式跟踪 #分析
  22. bd

    大数据工具包

    v0.1.1 #大数据 #json #jq #存储 #文档 #bigdata