103 个版本 (29 个重大变更)
新版本 0.31.0 | 2024年8月17日 |
---|---|
0.29.1 | 2024年7月16日 |
0.15.0 | 2024年3月27日 |
0.5.5 | 2023年12月18日 |
0.2.6 | 2023年7月31日 |
在 生物学 类别中排名 26
每月下载量 604
用于 3 个 仓库
4MB
28K SLoC
Exon 是一个专为生物信息学数据设计的执行引擎。它具有以下特点:
- 基于 SQL 访问生物信息学数据 -- 支持一般的 DML 和一些 DDL
- 支持来自生物信息学、蛋白质组学等多个领域的多种文件格式
- 支持本地文件系统和对象存储
- Arrow FFI 原语以支持多语言
安装
Exon 可通过 crates.io 获取。要安装,请运行
cargo add exon
文档
相关项目
基准测试
lib.rs
:
Exon 是一个库,旨在促进对科学数据的开放式分析,简化 ML 模型的应用,并为科学和工程团队提供一个通用数据接口。
概述
用户的主要接口是通过 datafusion 的 SessionContext
加上 ExonSessionExt
扩展 trait。它提供了一些方便的方法来从各种来源加载数据。
有关更多信息,请参阅 ExonSessionExt
上的 read_*
方法。例如,read_fasta
或 read_gff
。还有一个 read_inferred_exon_table
方法,它将尝试根据文件扩展名推断数据类型和压缩,以便于使用。
为了方便这些方法,Exon 为 DataFusion 实现了多个特性,这些特性是科学数据工作的良好基础。有关更多信息,请参阅 datasources
模块。
依赖关系
~88MB
~1.5M SLoC