2 个版本
使用旧版 Rust 2015
0.0.1004 | 2014年11月23日 |
---|---|
0.0.1003 | 2014年11月23日 |
在 #stemmer 中排名 8
395KB
482 行代码(不含注释)
Porter2 英语词干提取器
这是一个用 Rust 编写的 Porter2 英语词干提取器的不完整实现。这是我用来学习 Rust 的一个小玩具项目,同时做一些有用的东西。
请访问 rust-ci.org 检查 Rust 版本的兼容性。
非常感谢 mrordinaire 的 Rust Porter 词干提取器为我打下的基础!!
编译
我使用 Cargo!!!只需运行 cargo build
!!!!
运行测试
我使用 Cargo!!!只需运行 cargo test
!!!!
测试实际上只有一个测试,有很多案例——它遍历一些输入文件中的单词,并断言单词的词干与预期输出文件中相应的行匹配。
词干提取
编译后,你应在 target/porter2 中找到一个二进制文件,它将从 stdin 读取每行一个单词的单词列表,并将它们的词干打印到 stdout。
示例
./target/porter2 < test-data/voc.txt > output.txt
许可证
MIT。见 LICENSE。