#japanese-morphological #japanese #morphological #analyze #nlp #morpheme

bin+lib yoin

Yoin 是一个用纯 Rust 编写的日语形态分析器。此项目正在开发中

1 个不稳定版本

使用旧的 Rust 2015

0.0.1 2017年10月27日

#19#japanese-morphological

自定义许可证

10MB
2K SLoC

Yoin - 一个日语形态分析器

Build Status

此项目仍在开发中...

yoin 是一个用纯 Rust 编写的日语形态分析引擎。

mecab-ipadic 已嵌入到 yoin 中。

:) $ yoin
すもももももももものうち
すもも	名詞,一般,*,*,*,*,すもも,スモモ,スモモ
	助詞,係助詞,*,*,*,*,も,モ,モ
もも	名詞,一般,*,*,*,*,もも,モモ,モモ
	助詞,係助詞,*,*,*,*,も,モ,モ
もも	名詞,一般,*,*,*,*,もも,モモ,モモ
	助詞,連体化,*,*,*,*,の,ノ,ノ
うち	名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
EOS

构建和安装

yoincrates.io 上不可用,因为字典数据太大...

命令行界面

:) $ git clone https://github.com/agatan/yoin
:) $ cd yoin && cargo install

yoin 可以像这样包含在您的 Cargo 项目中

[dependencies]
yoin = { git = "https://github.com/agatan/yoin" }

并编写您的代码如下

extern crate yoin;

用法 - 命令行界面

默认情况下,yoin 从 stdin 读取行,分析每一行,并输出结果。

:) $ yoin
すもももももももものうち
すもも	名詞,一般,*,*,*,*,すもも,スモモ,スモモ
	助詞,係助詞,*,*,*,*,も,モ,モ
もも	名詞,一般,*,*,*,*,もも,モモ,モモ
	助詞,係助詞,*,*,*,*,も,モ,モ
もも	名詞,一般,*,*,*,*,もも,モモ,モモ
	助詞,連体化,*,*,*,*,の,ノ,ノ
うち	名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
EOS
そこではなしは終わりになった
そこで	接続詞,*,*,*,*,*,そこで,ソコデ,ソコデ
はなし	名詞,一般,*,*,*,*,はなし,ハナシ,ハナシ
	助詞,係助詞,*,*,*,*,は,ハ,ワ
終わり	動詞,自立,*,*,五段・ラ行,連用形,終わる,オワリ,オワリ
	助詞,格助詞,一般,*,*,*,に,ニ,ニ
なっ	動詞,自立,*,*,五段・ラ行,連用タ接続,なる,ナッ,ナッ
	助動詞,*,*,*,特殊・タ,基本形,た,タ,タ
EOS

或者,从文件中读取。

:) $ cat input.txt
すもももももももものうち
:) $ yoin --file input.txt
すもも	名詞,一般,*,*,*,*,すもも,スモモ,スモモ
	助詞,係助詞,*,*,*,*,も,モ,モ
もも	名詞,一般,*,*,*,*,もも,モモ,モモ
	助詞,係助詞,*,*,*,*,も,モ,モ
もも	名詞,一般,*,*,*,*,もも,モモ,モモ
	助詞,連体化,*,*,*,*,の,ノ,ノ
うち	名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
EOS

许可证

此软件受 MIT 许可证保护,并包含 MeCab-ipadic 模型。有关详细信息,请参阅 LICENSENOTICE.txt

依赖关系