7 个版本

使用旧的 Rust 2015

0.3.3 2019年11月4日
0.3.2 2019年2月9日
0.3.1 2018年12月23日
0.3.0 2017年9月9日
0.1.0 2016年2月3日

机器学习 分类下排名 #303


rsnltk 中使用

MIT 许可协议

14KB
298 行(不包括注释)

word2vec 构建状态

Rust 对 word2vec 词向量的接口

此 crate 提供了一种读取 word2vec 训练好的词向量文件的方法。它不提供模型训练,因此需要已经训练好的模型。

文档

文档可在 https://github.com/DimaKudosh/word2vec/wiki 找到

示例

将以下内容添加到您的 cargo.toml

[dependencies]
# …
word2vec = "0.3.3"

单词相似性和单词簇的示例

extern crate word2vec;

fn main(){
	let model = word2vec::wordvectors::WordVector::load_from_binary(
		"vectors.bin").expect("Unable to load word vector model");
	println!("{:?}", model.cosine("snow", 10));
	let positive = vec!["woman", "king"];
	let negative = vec!["man"];
	println!("{:?}", model.analogy(positive, negative, 10));
	
	let clusters = word2vec::wordclusters::WordClusters::load_from_file(
		"classes.txt").expect("Unable to load word clusters");
	println!("{:?}", clusters.get_cluster("belarus"));
	println!("{:?}", clusters.get_words_on_cluster(6));
}

依赖项

~120KB