#duck-db #ffi #native-bindings

duckdb-loadable-macros

libduckdb 库的本地绑定,C API;构建可加载扩展

3 个版本

0.1.2 2024年7月11日
0.1.1 2024年3月19日
0.1.0 2023年5月20日

数据库接口 中排名 #2512

Download history 5/week @ 2024-05-20 18/week @ 2024-06-03 14/week @ 2024-06-10 45/week @ 2024-06-17 15/week @ 2024-06-24 25/week @ 2024-07-01 129/week @ 2024-07-08 11/week @ 2024-07-15 61/week @ 2024-07-22 32/week @ 2024-07-29 23/week @ 2024-08-12

每月下载量 116
3 Crates 中使用(直接使用 2 个)

MIT 许可协议

11KB

duckdb-rs

Downloads Build Status dependency status codecov Latest Version Docs

duckdb-rs 是 Rust 使用 duckdb 的便捷包装器。它试图提供一个类似于 rusqlite 的接口。实际上,初始代码甚至这份 README 都是 fork 自 rusqlite,因为 duckdb 也试图提供一个与 sqlite3 兼容的 API。

use duckdb::{params, Connection, Result};

// In your project, we need to keep the arrow version same as the version used in duckdb.
// Refer to https://github.com/wangfenjin/duckdb-rs/issues/92
// You can either:
use duckdb::arrow::record_batch::RecordBatch;
// Or in your Cargo.toml, use * as the version; features can be toggled according to your needs
// arrow = { version = "*", default-features = false, features = ["prettyprint"] }
// Then you can:
// use arrow::record_batch::RecordBatch;

use duckdb::arrow::util::pretty::print_batches;

#[derive(Debug)]
struct Person {
    id: i32,
    name: String,
    data: Option<Vec<u8>>,
}

fn main() -> Result<()> {
    let conn = Connection::open_in_memory()?;

    conn.execute_batch(
        r"CREATE SEQUENCE seq;
          CREATE TABLE person (
                  id              INTEGER PRIMARY KEY DEFAULT NEXTVAL('seq'),
                  name            TEXT NOT NULL,
                  data            BLOB
                  );
        ")?;

    let me = Person {
        id: 0,
        name: "Steven".to_string(),
        data: None,
    };
    conn.execute(
        "INSERT INTO person (name, data) VALUES (?, ?)",
        params![me.name, me.data],
    )?;

    // query table by rows
    let mut stmt = conn.prepare("SELECT id, name, data FROM person")?;
    let person_iter = stmt.query_map([], |row| {
        Ok(Person {
            id: row.get(0)?,
            name: row.get(1)?,
            data: row.get(2)?,
        })
    })?;

    for person in person_iter {
        let p = person.unwrap();
        println!("ID: {}", p.id);
        println!("Found person {:?}", p);
    }

    // query table by arrow
    let rbs: Vec<RecordBatch> = stmt.query_arrow([])?.collect();
    print_batches(&rbs).unwrap();
    Ok(())
}

关于构建 duckdb 和 libduckdb-sys 的注意事项

libduckdb-sys 是一个独立的 crate,它提供了 DuckDB C API 的 Rust 声明。默认情况下,libduckdb-sys 尝试使用 pkg-config 在您的系统上找到已存在的 DuckDB 库,或者使用 MSVC ABI 构建版本的 Vcpkg 安装。

您可以通过多种方式调整此行为

  • 如果您使用 bundled 功能,libduckdb-sys 将使用 cc crate 从源代码编译 DuckDB 并链接到它。此源代码嵌入在 libduckdb-sys crate 中,因为我们仍在开发中,我们将定期更新它。在更加稳定后,我们将使用来自 duckdb 的稳定发布版本。这可能是解决任何构建问题的最简单方法。您可以通过在您的 Cargo.toml 文件中添加以下内容来启用此功能

    cargo add duckdb --features bundled
    

    Cargo.toml 将被更新。

    [dependencies]
    # Assume that version DuckDB version 0.9.2 is used.
    duckdb = { version = "0.9.2", features = ["bundled"] }
    
  • 当链接到系统上已有的 DuckDB 库(因此 使用任何 bundled 功能)时,您可以设置 DUCKDB_LIB_DIR 环境变量,使其指向包含库的目录。您还可以设置 DUCKDB_INCLUDE_DIR 变量,使其指向包含 duckdb.h 的目录。

  • 通常安装 duckdb 开发包就足够了,但 pkg-configvcpkg 的构建辅助程序有一些额外的配置选项。使用 vcpkg 的默认行为是动态链接,这必须通过在构建之前设置 VCPKGRS_DYNAMIC=1 环境变量来启用。

绑定生成

我们使用 bindgen 从 DuckDB 的 C 头文件生成 Rust 声明。 bindgen这里 推荐将此作为使用此库的库构建过程的一部分运行。我们尝试过这种方法(duckdb 0.10.0,具体来说),但它有一些令人烦恼的地方。

  • libduckdb-sys(以及因此 duckdb)的构建时间显著增加。
  • 运行 bindgen 需要一个相对较新的 Clang 版本,而许多系统默认并未安装。
  • 运行 bindgen 还需要 DuckDB 头文件存在。

因此,我们尝试通过提供预生成的 DuckDB 绑定来避免在构建时运行 bindgen

如果您使用 bundled 功能,您将获得捆绑版 DuckDB 的预生成绑定。如果您想在构建时运行 bindgen 生成自己的绑定,请使用 buildtime_bindgen Cargo 功能。

贡献

请参阅 Contributing.md

清单

  • 运行 cargo +nightly fmt 确保您的 Rust 代码格式正确。
  • 运行 cargo clippy --fix --allow-dirty --all-targets --workspace --all-features -- -D warnings 修复所有 clippy 问题。
  • 确保 cargo test --all-targets --workspace --features "modern-full extensions-full" 没有失败。

待办事项

  • 重构 ErrorCode 部分,它是从 rusqlite 借用的,我们应该有自己的
  • 支持更多类型
  • 更新 duckdb.h
  • 调整代码示例和文档
  • 删除未使用的代码/函数
  • 添加 CI
  • 发布到 crate

许可证

DuckDB 和 libduckdb-sys 在 MIT 许可证下可用。有关更多信息,请参阅 LICENSE 文件。

依赖关系

~265–710KB
~17K SLoC