103 个版本 (29 个重大变更)
| 新版本 0.31.0 | 2024年8月17日 |
|---|---|
| 0.29.1 | 2024年7月16日 |
| 0.15.0 | 2024年3月27日 |
| 0.5.5 | 2023年12月18日 |
| 0.2.6 | 2023年7月31日 |
在 生物学 类别中排名 26
每月下载量 604
用于 3 个 仓库
4MB
28K SLoC
Exon 是一个专为生物信息学数据设计的执行引擎。它具有以下特点:
- 基于 SQL 访问生物信息学数据 -- 支持一般的 DML 和一些 DDL
- 支持来自生物信息学、蛋白质组学等多个领域的多种文件格式
- 支持本地文件系统和对象存储
- Arrow FFI 原语以支持多语言
安装
Exon 可通过 crates.io 获取。要安装,请运行
cargo add exon
文档
相关项目
基准测试
lib.rs:
Exon 是一个库,旨在促进对科学数据的开放式分析,简化 ML 模型的应用,并为科学和工程团队提供一个通用数据接口。
概述
用户的主要接口是通过 datafusion 的 SessionContext 加上 ExonSessionExt 扩展 trait。它提供了一些方便的方法来从各种来源加载数据。
有关更多信息,请参阅 ExonSessionExt 上的 read_* 方法。例如,read_fasta 或 read_gff。还有一个 read_inferred_exon_table 方法,它将尝试根据文件扩展名推断数据类型和压缩,以便于使用。
为了方便这些方法,Exon 为 DataFusion 实现了多个特性,这些特性是科学数据工作的良好基础。有关更多信息,请参阅 datasources 模块。
依赖关系
~88MB
~1.5M SLoC