Apache Arrow

  1. arrow

    Apache Arrow

    v52.2.0 1.0M #apache-arrow #数据 #内存 #数组 #格式 #默认 #cargo
  2. object_store

    一种通用的对象存储接口,用于统一与AWS S3、Google Cloud Storage、Azure Blob Storage和本地文件交互

    v0.11.0 1.6M #azure-blob #google-cloud #cloud-storage #object #object-storage #cloud #apache-arrow
  3. parquet

    Rust中的Apache Parquet实现

    v52.2.0 738K #apache-arrow #arrow #hadoop #brotli #数组 #压缩 #默认
  4. polars

    基于Apache Arrow的DataFrame库

    v0.42.0 162K #dataframe #apache-arrow #查询引擎 #arrow #列式格式 #SQL查询
  5. datafusion

    使用Apache Arrow作为内存模型的内存查询引擎

    v41.0.0 703K #apache-arrow #arrow #hadoop #brotli #数组 #压缩 #默认
  6. datafusion-expr

    数据融合查询引擎的逻辑计划和表达式表示

    v41.0.0 703K #expression #data-fusion #plan #logical #datafusion #apache-arrow
  7. arrow-odbc

    从/到ODBC数据源读取/写入Apache Arrow数组

    v12.0.0 2.3K #apache-arrow #arrow #odbc #database #database-table #sql #data-access
  8. lance

    一种列式数据格式,比Parquet随机访问快100倍

    v0.16.1 3.6K #data-science #machine-learning #random-access #apache-arrow #data-analytics #columnar-format #data-format
  9. arrow-ipc

    支持Arrow IPC格式

    v52.2.0 1.2M #arrow #apache-arrow #columnar-format #ipc #memory-layout #array #low-level
  10. narrow

    Apache Arrow

    v0.8.2 4.9K #apache-arrow #arrow #data #data-structures #array #实验性 #in-memory
  11. arrow-cast

    Apache Arrow 的铸核和工具

    v52.2.0 1.1M #apache-arrow #arrow #cast #columnar-format #array #memory-layout #computation
  12. datafusion-proto

    DataFusion 逻辑计划表达式的 Protobuf 序列化

    v41.0.0 340K #query #sql-query #arrow #apache-arrow #sql
  13. arrow-array

    Apache Arrow 的数组抽象

    v52.2.0 1.2M #array #apache-arrow #arrow #builder #vec #values #int32-array
  14. datafusion-physical-expr

    DataFusion 查询引擎的物理表达式实现

    v41.0.0 714K #query-execution #apache-arrow #sql-query #query #arrow #sql
  15. datafusion-server

    使用 Arrow 和其他大型数据集作为数据源的基于会话的查询的 Web 服务器库

    v0.19.1 19K #sql-query #arrow #web-server #data-fusion #sql #apache-arrow #datafusion
  16. arrow-buffer

    Apache Arrow 的缓冲区抽象

    v52.2.0 1.1M #apache-arrow #arrow #columnar-format #buffer #memory-buffer #object-store #abstraction
  17. arrow-schema

    定义 arrow 数组的逻辑类型

    v52.2.0 1.2M #arrow #apache-arrow #columnar-format #logical #parquet #types #arrays
  18. arrow-digest

    Apache Arrow 的稳定哈希值

    v52.0.0 900 #apache-arrow #hash #arrow #digest
  19. arrow-ord

    arrow 数组的排序内核

    v52.2.0 1.0M #arrow #sorting #array #apache-arrow #order #columnar-format #memory
  20. arrow-format

    Apache Arrow 规范的非官方 flatbuffers 和 tonic 代码

    v0.8.1 96K #apache-arrow #arrow #flat-buffers #analytics #flight #tonic #format
  21. arrow-arith

    Arrow 算术内核

    v52.2.0 1.0M #apache-arrow #array #arrow #columnar-format #arithmetic #computation #kernels
  22. arrow-select

    Arrow数组的选择核

    v52.2.0 1.1M #arrow #array #apache-arrow #selection #kernels #columnar #in-memory
  23. datafusion-execution

    DataFusion查询引擎的执行配置支持

    v41.0.0 703K #query-execution #query #sql-query #arrow #sql #execution-engine #apache-arrow
  24. arrow-data

    Apache Arrow的数组数据抽象

    v52.2.0 1.2M #apache-arrow #arrow #columnar-format #data #array #abstraction #computation
  25. arrow-csv

    支持将CSV格式解析为Arrow格式以及从Arrow格式解析CSV

    v52.2.0 988K #apache-arrow #csv #arrow #data #format #file-format #parser
  26. arrow-json

    支持将JSON格式解析为Arrow格式以及从Arrow格式解析JSON

    v52.2.0 981K #json #format-json #arrow #apache-arrow #json-parser #data #reader
  27. datafusion-functions-array

    DataFusion查询引擎的数组函数包

    v40.0.0 704K #data-fusion #apache-arrow #datafusion #logical #plan #expressions #sql-query
  28. datafusion-optimizer

    DataFusion查询优化器

    v41.0.0 702K #optimization #query #data-fusion #datafusion #sql-query #apache-arrow #optimize
  29. datafusion-python

    Apache DataFusion DataFrame和SQL查询引擎

    v40.1.0 #sql-query #query-engine #python-bindings #data-fusion #dataframe #apache-arrow #parquet
  30. datafusion-functions

    DataFusion查询引擎的函数包

    v41.0.0 677K #data-fusion #datafusion #expressions #apache-arrow #plan #logical #expression
  31. lance-datagen

    一种列式数据格式,比Parquet随机访问快100倍

    v0.16.1 3.2K #random-access #data-science #machine-learning #data-analytics #apache-arrow #data-format #data-access
  32. ballista

    分布式计算

    v0.12.0 #apache-arrow #distributed #scheduler #query-engine #data-fusion #data-processing #big-data
  33. arrow-flight

    Apache Arrow Flight

    v52.2.0 88K #apache-arrow #flight #sql-database #protocols #flight-sql #experimental #api
  34. arrow-string

    箭头数组字符串内核

    v52.2.0 1.0M #arrow #apache-arrow #format-string #columnar-format #array #kernels #memory
  35. datafusion-physical-plan

    数据融合查询引擎的物理(执行计划)实现

    v41.0.0 696K #query-execution #query #sql-query #arrow #apache-arrow #sql
  36. myval

    轻量级Apache Arrow数据框

    v0.1.22 170 #dataframe #apache-arrow #arrow #convert #machine-learning #database
  37. connector_arrow

    将数据从数据库加载到Apache Arrow,最快的方式

    v0.5.0 6.0K #apache-arrow #database-client #load #connector #interop #convert #format
  38. orc-rust

    使用Apache Arrow内存格式实现的Apache ORC文件格式

    v0.3.1 550 #file-format #apache-arrow #arrow #orc #datafusion #data-fusion #arrow-rs
  39. datafusion-substrait

    DataFusion Substrait生产者和消费者

    v41.0.0 5.8K #data-fusion #producer-consumer #substrait #apache-arrow #big-data #plan #query-engine
  40. evolution

    🦖 将固定长度数据文件进化为Apache Parquet,完全并行化!

    v1.0.0 #apache-arrow #arrow #schema-file #format #data-engineering #apache-parquet #file-format
  41. dora-record

    dora的目标是成为一个低延迟、可组合和分布式的数据流

    v0.3.5 #low-latency #data-flow #apache-arrow #distributed #recording #composable #parquet
  42. re_arrow2

    在安全Rust中实现的Apache Arrow规范的非官方实现

    v0.17.5 55K #arrow #arrow2 #apache-arrow #analytics #safe #fork #spec
  43. ar_row

    对箭头数组的行导向访问

    v1.0.0 下载次数:200 #apache-arrow #proc-macro #columnar #row #data-access #array #structures
  44. arrow-row

    Arrow行格式

    v52.2.0 下载次数:1.0M #arrow #apache-arrow #row #format #array #sorting #byte
  45. datafusion-common

    DataFusion查询引擎的常用功能

    v41.0.0 下载次数:714K #arrow #sql-query #query #sql #apache-arrow #query-execution #utilities
  46. lance-datafusion

    其他lance模块用于简化与datafusion工作的内部实用工具

    v0.16.1 下载次数:3.6K #apache-arrow #data-science #data-analytics #machine-learning #data-format #random-access
  47. duckdb-server

    Mosaic的DuckDB服务器

    v0.1.0 下载次数:130 #duck-db #server #local-server #apache-arrow #websockets #json-format #cargo
  48. arrow-integration-test

    支持Apache Arrow JSON测试数据格式

    v52.2.0 下载次数:460 #arrow #apache-arrow #json #json-format #columnar-format #testing #integration-tests
  49. arrow-udf

    arrow-rs的用户自定义函数框架

    v0.3.0 下载次数:1.3K #arrow #user-defined #udf #framework #apache-arrow #functions #batch
  50. datafusion-cli

    DataFusion查询引擎的命令行客户端

    v41.0.0 下载次数:950 #sql-query #apache-arrow #data-fusion #sql #arrow #query #datafusion
  51. fsst

    FSST字符串压缩

    v0.16.1 下载次数:2.2K #apache-arrow #data-science #data-analytics #machine-learning #data-format
  52. datafusion-catalog

    v41.0.0 #data-fusion #query-engine #apache #sql-query #apache-arrow #dataframe #python
  53. pyo3-arrow

    pyo3的Arrow集成

    v0.2.0 下载次数:120 #arrow #apache-arrow #pyo3 #zero-copy #interop #python-bindings #array
  54. arrow-udf-js

    Arrow UDFs的JavaScript运行时

    v0.3.2 2.2K #arrow #udf #javascript #apache-arrow
  55. datafusion-physical-optimizer

    数据融合物理优化器

    v41.0.0 1.4K #optimization #query #datafusion #数据融合 #apache-arrow #optimizer
  56. tpctools

    生成和转换 TPC-H 和 TPC-DS 数据集

    v0.7.0 #tpc-ds #tpc-h #apache-arrow #parquet #sets #generate #parallel
  57. arrow-avro

    支持将 Avro 格式解析为 Arrow 格式

    v52.2.0 180 #arrow #apache-arrow #avro #columnar-format #data #convert #parser
  58. valu3

    通用的序列化/反序列化/类型框架

    v0.5.2 130 #value #data-transformation #generic #type #apache-arrow #parser #serde
  59. ballista-executor

    Ballista 分布式计算 - 执行器

    v0.12.0 #apache-arrow #distributed #query-engine #big-data #executor #compute #ballista
  60. arrow-tools

    v0.18.1 110 #arrow #suite #general #within #cli #packages #apache-arrow
  61. lance-linalg

    一种列式数据格式,比Parquet随机访问快100倍

    v0.16.1 3.6K #random-access #apache-arrow #linear-algebra #data-analytics #data-science #machine-learning #data-format
  62. datafusion-physical-expr-common

    数据融合查询引擎物理表达式的通用功能

    v41.0.0 612K #sql-query #apache-arrow #arrow #query #query-execution #sql #execution-engine
  63. lance-arrow

    Lance 的 Arrow 扩展

    v0.16.1 3.9K #apache-arrow #data-science #data-analytics #machine-learning #data-format #columnar-format
  64. lance-testing

    一种列式数据格式,比Parquet随机访问快100倍

    v0.16.1 3.8K #random-access #data-analytics #data-science #apache-arrow #machine-learning #data-format
  65. datafusion-functions-nested

    数据融合查询引擎嵌套类型函数包

    v41.0.0 #datafusion #data-fusion #plan #expressions #logical #apache-arrow
  66. datafusion-common-runtime

    DataFusion查询引擎的通用运行时功能

    v41.0.0 682K #sql-query #query #arrow #sql #apache-arrow #query-execution
  67. lance-jni

    Lance列式格式的JNI绑定

    v0.16.1 370 #machine-learning #columnar-format #data-analytics #apache-arrow #data-science #data-format #random-access
  68. ballista-cli

    Ballista分布式查询引擎的命令行客户端

    v0.12.0 #query-engine #ballista #cli #distributed #sql-query #big-data #apache-arrow
  69. lance-index

    Lance索引实现

    v0.16.1 3.6K #machine-learning #data-analytics #apache-arrow #data-science #data-format #random-access #data-access
  70. csv2parquet

    将CSV文件转换为Parquet

    v0.18.1 240 #csv #parquet #convert #arrow #apache-arrow #schema #arrow-tools
  71. re_data_store

    基于Apache Arrow的Rerun日志数据的内存时间序列数据库

    v0.17.0 46K #time-series-database #apache-arrow #data-store #rerun #memory #log #columnar
  72. lance-io

    Lance的I/O工具

    v0.16.1 3.5K #machine-learning #apache-arrow #data-analytics #data-science #data-format #codec
  73. polars-arrow-format

    Apache Arrow 规范的非官方 flatbuffers 和 tonic 代码

    v0.1.0 61K #apache-arrow #arrow #flat-buffers #analytics #ipc #flight #tonic
  74. lance-file

    Lance文件格式

    v0.16.1 3.7K #file-format #data-analytics #machine-learning #data-science #apache-arrow #file-reader #data-format
  75. lance-table

    Lance表格格式

    v0.16.1 3.5K #data-science #machine-learning #data-analytics #apache-arrow #data-format #random-access
  76. arrow-udf-python

    Arrow UDF的Python运行时

    v0.2.2 1.6K #arrow #python #udf #apache-arrow
  77. lance-encoding

    Lance文件格式的编码和解码器

    v0.16.1 3.6K #codec #data-analytics #file-format #data-science #machine-learning #random-access #apache-arrow
  78. json2parquet

    将JSON文件转换为Parquet

    v0.18.1 #convert-json #parquet #arrow #apache-arrow #arrow-tools #domoritz
  79. csv2arrow

    将CSV文件转换为Arrow

    v0.18.1 120 #csv #apache-arrow #convert #arrow-tools
  80. ballista-scheduler

    Ballista分布式计算 - 调度器

    v0.12.0 #scheduler #distributed #apache-arrow #ballista #big-data #compute #query-engine
  81. foreign_vec

    在安全Rust中实现的Apache Arrow规范的非官方实现

    v0.1.0 216K #apache-arrow #safe #spec #foreign #vec
  82. json2arrow

    将JSON文件转换为Arrow

    v0.18.1 #json #convert-json #arrow #apache-arrow #arrow-tools #cli
  83. lance-encoding-datafusion

    依赖datafusion的Lance文件格式编码和解码器

    v0.16.1 380 #apache-arrow #data-science #data-analytics #machine-learning #codec #data-format #file-format
  84. ballista-cache

    Ballista缓存

    v0.12.0 #cache #ballista #distributed #arrow #apache-arrow #query
  85. strawboat

    基于Apache Arrow的本地存储格式

    v0.2.6 #apache-arrow #arrow #analytics #storage
  86. arrow-udf-wasm

    Arrow UDF的WebAssembly运行时

    v0.2.2 1.8K #wasm-module #arrow #udf #wasm #apache-arrow #cargo-toml
  87. oxbow

    在R、Python等中读取专门的生物信息学文件格式作为数据帧

    v0.3.1 #file-format #data-frames #bioinformatics #apache-arrow #frame #python #analytics
  88. arrow-flightsql-odbc

    一个Apache Arrow Flight SQL服务器,它通过ODBC代理请求

    v0.3.0 #apache-arrow #sql-server #odbc #flight-sql #data-source
  89. datafusion-row

    基于原始字节的 DataFusion 查询引擎行

    v27.0.0 650 #query #sql-query #apache-arrow #arrow #sql #query-execution
  90. gmt_dos-clients_arrow

    GMT DOS Arrow 客户端

    v2.1.0 #telescope #arrow #apache-arrow #logger #data #parquet #client
  91. pyspark-arrow-rs

    推导宏,用于将一些辅助函数添加到 Rust 结构体中,以便在 PySpark 的 mapInArrow 中使用

    v0.3.0 #apache-arrow #python #spark #pyspark #interop #macro-derive #etl
  92. re_arrow_store

    基于Apache Arrow的Rerun日志数据的内存时间序列数据库

    v0.12.0-alpha.3 #time-series-database #apache-arrow #log #data-store #rerun #queries #component
  93. prost-arrow

    从 prost 生成的 protobuf 消息推导 Apache Arrow 数组构建器

    v0.0.3 #arrow #prost #protobuf #apache-arrow #grpc #rpc
  94. lance-core

    Lance 列式格式 -- 核心库

    v0.16.1 3.7K #columnar-format #data-analytics #data-science #machine-learning #apache-arrow #data-format #random-access
  95. pgpq

    将 Apache Arrow RecordBatch 编码为 PostgreSQL 的本地二进制格式

    v0.9.0 #apache-arrow #binary-format #postgresql #convert #record-batches #encode #native
  96. dfq

    一个 CLI 工具,用于在多种数据源上运行 SQL 查询

    v0.1.1 #sql-query #data-source #sql #csv #datafusion #json #apache-arrow
  97. 尝试使用 DuckDuckGo 进行搜索。

  98. datafusion-jit

    为 DataFusion 查询引擎提供即时 (JIT) 编译支持

    v23.0.0 #query #sql-query #arrow #sql #query-execution #apache-arrow
  99. valu3-parquet

    为 valu3 提供 Parquet 和 Arrow 编码和解码

    v0.4.5 #apache-arrow #parquet #arrow #valu3 #apache #codec #generic
  100. datafusion-data-access

    通用数据访问层,目前主要基于对象存储接口

    v10.0.0 #apache-arrow #query-execution #data-access #arrow #query #sql-query #sql
  101. convergence-arrow

    Apache Arrow 和 PostgreSQL 线协议桥接工具

    v0.16.0 #apache-arrow #postgresql #protocols #wire #bridging
  102. gandiva_rust_udf

    gandiva rust udfs

    v0.1.0 #apache-arrow #udf #gandiva
  103. arrow2

    在安全Rust中实现的Apache Arrow规范的非官方实现

    v0.18.0 97K #array #apache-arrow #arrow #operation #sorting #arithmetic #compute
  104. ballista-core

    Ballista 分布式计算

    v0.12.0 #distributed #ballista #compute #query #arrow #apache-arrow #big-data
  105. arrow_util

    Apache Arrow 工具

    v0.1.3 #arrow #dataframe #convert #apache-arrow #database
  106. lance-test-macros

    一种列式数据格式,比Parquet随机访问快100倍

    v0.16.1 410 #data-science #data-analytics #apache-arrow #machine-learning #data-format #random-access
  107. mongodb-arrow-connector

    MongoDB 连接器,用于在 Apache Arrow 之间读取和写入数据

    v0.7.0 #apache-arrow #mongo-db #read #write #connector #collection #batch
  108. datafusion-bigtable

    Apache Arrow Datafusion 的 Bigtable 数据源

    v0.1.0 #bigtable #datafusion #arrow #apache-arrow #data-source #data-fusion #sql
  109. polars_arrow_rvsry99dx

    Apache Arrow

    v0.17.1 #arrow #apache-arrow #data #native #platform #in-memory
  110. katniss-pb2arrow

    工作进展中

    v0.0.3 #schema #arrow #protobuf #convert #message #table #apache-arrow
  111. alloy-rs

    使用任何支持 C 的语言与 Apache Arrow ffi 交互的静态 Rust 库

    v0.2.1 160 #apache-arrow #language #datatype
  112. narrow-derive

    Apache Arrow

    v0.6.8 5.0K #arrow #apache-arrow #narrow #derive #array #experimental #type
  113. iron-arrow

    Apache Arrow

    v0.1.0 #arrow #apache-arrow #set #status
  114. peppi-arrow

    peppi 的支持包

    v0.2.3 #arrow #apache-arrow #peppi #internal #conversion #slippi
  115. ar_row_derive

    使用 ar_row 从行式访问到 Arrow 数组的过程宏

    v1.0.0 190 #arrow #apache-arrow #proc-macro #row #arrays #data #access
  116. parquet2arrow

    将 Parquet 文件转换为 Apache Arrow 文件的命令行工具 (CLI)

    v0.1.0 #parquet-file #apache-arrow #convert #tool #command-line-tool #converter #parquet2arrow-rs