1 个不稳定版本
使用旧的 Rust 2015
0.0.1 | 2017年10月27日 |
---|
#19 在 #japanese-morphological
10MB
2K SLoC
Yoin - 一个日语形态分析器
此项目仍在开发中...
yoin
是一个用纯 Rust 编写的日语形态分析引擎。
mecab-ipadic 已嵌入到 yoin
中。
:) $ yoin
すもももももももものうち
すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
の 助詞,連体化,*,*,*,*,の,ノ,ノ
うち 名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
EOS
构建和安装
yoin
在 crates.io 上不可用,因为字典数据太大...
命令行界面
:) $ git clone https://github.com/agatan/yoin
:) $ cd yoin && cargo install
库
yoin 可以像这样包含在您的 Cargo 项目中
[dependencies]
yoin = { git = "https://github.com/agatan/yoin" }
并编写您的代码如下
extern crate yoin;
用法 - 命令行界面
默认情况下,yoin
从 stdin 读取行,分析每一行,并输出结果。
:) $ yoin
すもももももももものうち
すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
の 助詞,連体化,*,*,*,*,の,ノ,ノ
うち 名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
EOS
そこではなしは終わりになった
そこで 接続詞,*,*,*,*,*,そこで,ソコデ,ソコデ
はなし 名詞,一般,*,*,*,*,はなし,ハナシ,ハナシ
は 助詞,係助詞,*,*,*,*,は,ハ,ワ
終わり 動詞,自立,*,*,五段・ラ行,連用形,終わる,オワリ,オワリ
に 助詞,格助詞,一般,*,*,*,に,ニ,ニ
なっ 動詞,自立,*,*,五段・ラ行,連用タ接続,なる,ナッ,ナッ
た 助動詞,*,*,*,特殊・タ,基本形,た,タ,タ
EOS
或者,从文件中读取。
:) $ cat input.txt
すもももももももものうち
:) $ yoin --file input.txt
すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
の 助詞,連体化,*,*,*,*,の,ノ,ノ
うち 名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
EOS
许可证
此软件受 MIT 许可证保护,并包含 MeCab-ipadic 模型。有关详细信息,请参阅 LICENSE
和 NOTICE.txt
。