#cdb #python #access #zero-copy #interface #read #table

无 std 程序+库 cordoba

支持 Python 接口的零拷贝和可 mmap 的 CDB 访问库

7 个版本

0.3.4 2020 年 9 月 8 日
0.3.3 2020 年 3 月 4 日
0.3.1 2019 年 2 月 21 日
0.2.0 2019 年 2 月 15 日
0.1.0 2018 年 5 月 25 日

#6#cdb

每月 27 次下载
用于 cordoba-py

GPL-3.0+

27KB
731

cordoba 零拷贝 CDB 访问库

CDBReader 主要用于在 mmaped 字节切片上操作。对于小文件,也可以选择将整个文件加载到内存中。

任何支持 Read + Seek 的类型的文件访问实现都不进行优化,除了移除冗余的 seek。如果使用 BufReader,建议使用相对较小的缓冲区大小,因为哈希表读取是在每次值访问时完成的。

API 文档

计划的功能

按优先级排序。

  • 使用 PyO3 的 Python 接口。
  • 通用的 cdb 可执行文件,主要与 tinycdb 兼容。
  • 使 CDB 布局通用且可定制,允许文件大于 4 GiB 或对键和值的对齐。

依赖关系

~0–0.8MB
~12K SLoC