#label #encoder #machine-learning

labello

具有可配置类型的简单标签编码器

4 个版本

0.0.5 2020 年 9 月 8 日
0.0.3 2020 年 9 月 8 日
0.0.2 2020 年 9 月 3 日
0.0.1 2020 年 9 月 3 日

#533机器学习

每月 22 次下载

Apache-2.0/MIT

17KB
312

Labello:Rust 中的快速标签编码器

该包提供了一个简单的 API,用于编码由向量表示的标签。它使用哈希表作为类及其映射的内部数据结构。

示例


// load data in a vector
let data: Vec<String> = vec!["hello".to_string(),
                             "world".to_string(),
                             "world".to_string(),
                             "world".to_string(),
                             "world".to_string(),
                             "again".to_string(),
                             "hello".to_string(),
                             "again".to_string(),
                             "goodbye".to_string()];

// define type of encoder and configuration for fitting
let enctype = EncoderType::Ordinal;
let config = Config{
            max_nclasses: Some(3),
            mapping_function: None
};
// create encoder of <enctype>
let mut enc: Encoder<String> = Encoder::new(Some(enctype));

// fit encoder with this configuration
enc.fit(&data, &config);

// transform original data to internal encoded representation
let trans_data = enc.transform(&data);

// inverse transform internal encoded representation to original data
let recon_data = enc.inverse_transform(&trans_data);

// get unique original elements
let uniques = enc.uniques();

依赖项

~8–18MB
~235K SLoC