19 个版本
0.1.12 | 2020年7月10日 |
---|---|
0.1.11 | 2020年7月8日 |
0.0.8 | 2020年7月6日 |
46 在 #natural
每月48 次下载
34KB
744 代码行
So Many Words!!
这会写出很多单词,并不适合阅读。也许这最终可以用于有方向的自动翻译。
cargo run --bin tokenize [input]
cargo run --bin stem [language] [input]
cargo run --bin detect [input]
cargo run --bin eudex [input]
cargo run --bin build_phoneme [language] [input]
cargo run --bin search_phoneme [terms]
部分支持以下语言:阿拉伯语、丹麦语、荷兰语、英语、法语、德语、希腊语、匈牙利语、意大利语、挪威语、葡萄牙语、罗马尼亚语、俄语、西班牙语、瑞典语、泰米尔语、土耳其语
如果您想为此项目或更广泛地贡献于任何开放自然语言处理项目,请查看我的待办事项页面以获取开放问题。
贡献
除非您明确声明,否则您提交给 so_many_words 的任何有意贡献,都将根据 MIT 和 Apache 2.0 许可证双许可,不附加任何额外条款或条件。
依赖项
~10MB
~141K SLoC