#stemmer #english #incomplete #porter #stemming

nightly bin+lib porter2

Porter 2 英语词干提取器的不完整实现

2 个版本

使用旧版 Rust 2015

0.0.1004 2014年11月23日
0.0.1003 2014年11月23日

#stemmer 中排名 8

MIT 许可协议

395KB
482 行代码(不含注释)

Porter2 英语词干提取器

Build Status

这是一个用 Rust 编写的 Porter2 英语词干提取器的不完整实现。这是我用来学习 Rust 的一个小玩具项目,同时做一些有用的东西。

请访问 rust-ci.org 检查 Rust 版本的兼容性。

非常感谢 mrordinaire 的 Rust Porter 词干提取器为我打下的基础!!

编译

我使用 Cargo!!!只需运行 cargo build!!!!

运行测试

我使用 Cargo!!!只需运行 cargo test!!!!

测试实际上只有一个测试,有很多案例——它遍历一些输入文件中的单词,并断言单词的词干与预期输出文件中相应的行匹配。

词干提取

编译后,你应在 target/porter2 中找到一个二进制文件,它将从 stdin 读取每行一个单词的单词列表,并将它们的词干打印到 stdout。

示例

./target/porter2 < test-data/voc.txt > output.txt

许可证

MIT。见 LICENSE。

无运行时依赖