#nlp #split #words #english #string #frequencies #wikipedia

bin+lib untanglr

基于英语维基百科单语词频,使用NLP概率分割连接词

2个稳定版本

1.1.0 2022年9月2日
1.0.0 2022年1月31日
0.6.0 2021年7月29日
0.5.0 2021年7月28日
0.3.0 2021年7月22日

#926 in 文本处理

MIT 许可证

4MB
139

Untanglr

Untanglr

Untanglr接收一些混乱的词,并将它们变得有意义,这样你就不必这样做。它遍历输入并将其概率分割成单词。该软件包包括bin.rs和lib.rs,以便用作命令行工具,以及作为可以在你的代码中使用的库。

用法

将混乱的词作为cli参数传递

$ untanglr thequickbrownfoxjumpedoverthelazydog
the quick brown fox jumped over the lazy dog

或在项目中使用它

extern crate untanglr;

fn main() {
	let lm = untanglr::LanguageModel::new();
	println!("{:?}", lm.untangle("helloworld"));
}

安装

如果你觉得untanglr可能在你的机器上很有用,你可以安装它。只需确保已安装cargo并运行

$ cargo install untanglr

注意:如果这个项目已经有一段时间没有更新,请不要气馁。我会解决潜在的问题,但这个软件包不需要定期更新。

致谢

我在此项目中围绕Derek Anderson的wordninja Python实现进行了一些Rust练习,同时产生了一些有用的东西。

依赖项