103 个版本 (29 个重大变更)

新版本 0.31.0 2024年8月17日
0.29.1 2024年7月16日
0.15.0 2024年3月27日
0.5.5 2023年12月18日
0.2.6 2023年7月31日

生物学 类别中排名 26

Download history 61/week @ 2024-05-03 30/week @ 2024-05-10 599/week @ 2024-05-17 892/week @ 2024-05-24 188/week @ 2024-05-31 56/week @ 2024-06-07 663/week @ 2024-06-14 284/week @ 2024-06-21 33/week @ 2024-06-28 27/week @ 2024-07-05 474/week @ 2024-07-12 145/week @ 2024-07-19 245/week @ 2024-07-26 133/week @ 2024-08-02 36/week @ 2024-08-09 186/week @ 2024-08-16

每月下载量 604
用于 3 个 仓库

Apache-2.0 协议

4MB
28K SLoC

Exon

Exon 是一个专为生物信息学数据设计的执行引擎。它具有以下特点:

  • 基于 SQL 访问生物信息学数据 -- 支持一般的 DML 和一些 DDL
  • 支持来自生物信息学、蛋白质组学等多个领域的多种文件格式
  • 支持本地文件系统和对象存储
  • Arrow FFI 原语以支持多语言

安装

Exon 可通过 crates.io 获取。要安装,请运行

cargo add exon

文档

  • Rust 文档在此处可用:here.
  • 通用文档在此处可用:here.

基准测试

请参阅 基准测试README 以获取更多信息。


lib.rs:

Exon 是一个库,旨在促进对科学数据的开放式分析,简化 ML 模型的应用,并为科学和工程团队提供一个通用数据接口。

概述

用户的主要接口是通过 datafusion 的 SessionContext 加上 ExonSessionExt 扩展 trait。它提供了一些方便的方法来从各种来源加载数据。

有关更多信息,请参阅 ExonSessionExt 上的 read_* 方法。例如,read_fastaread_gff。还有一个 read_inferred_exon_table 方法,它将尝试根据文件扩展名推断数据类型和压缩,以便于使用。

为了方便这些方法,Exon 为 DataFusion 实现了多个特性,这些特性是科学数据工作的良好基础。有关更多信息,请参阅 datasources 模块。

依赖关系

~88MB
~1.5M SLoC