4 个版本
0.0.5 | 2020 年 9 月 8 日 |
---|---|
0.0.3 | 2020 年 9 月 8 日 |
0.0.2 | 2020 年 9 月 3 日 |
0.0.1 | 2020 年 9 月 3 日 |
#533 在 机器学习 中
每月 22 次下载
17KB
312 行
Labello:Rust 中的快速标签编码器
该包提供了一个简单的 API,用于编码由向量表示的标签。它使用哈希表作为类及其映射的内部数据结构。
示例
// load data in a vector
let data: Vec<String> = vec!["hello".to_string(),
"world".to_string(),
"world".to_string(),
"world".to_string(),
"world".to_string(),
"again".to_string(),
"hello".to_string(),
"again".to_string(),
"goodbye".to_string()];
// define type of encoder and configuration for fitting
let enctype = EncoderType::Ordinal;
let config = Config{
max_nclasses: Some(3),
mapping_function: None
};
// create encoder of <enctype>
let mut enc: Encoder<String> = Encoder::new(Some(enctype));
// fit encoder with this configuration
enc.fit(&data, &config);
// transform original data to internal encoded representation
let trans_data = enc.transform(&data);
// inverse transform internal encoded representation to original data
let recon_data = enc.inverse_transform(&trans_data);
// get unique original elements
let uniques = enc.uniques();
依赖项
~8–18MB
~235K SLoC