3 个不稳定版本

0.2.2 2020年7月19日
0.2.0 2020年7月11日
0.1.1 2020年7月8日

#2163开发工具

MIT 许可证

7KB
58

pyawabi

pyawabi 是 awabi(https://github.com/nakagami/awabi) 的 Python 包装器。

需求

安装

$ pip install setuptools-rust
$ pip install pyawabi

示例

>>> import pyawabi
>>> import pprint
>>> pp = pprint.PrettyPrinter()
>>> pp.pprint(pyawabi.awabi.tokenize("すもももももももものうち"))
[('すもも', '名詞,一般,*,*,*,*,すもも,スモモ,スモモ'),
 ('', '助詞,係助詞,*,*,*,*,,,'),
 ('もも', '名詞,一般,*,*,*,*,もも,モモ,モモ'),
 ('', '助詞,係助詞,*,*,*,*,,,'),
 ('もも', '名詞,一般,*,*,*,*,もも,モモ,モモ'),
 ('', '助詞,連体化,*,*,*,*,,,'),
 ('うち', '名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ')]
>>> pp.pprint(pyawabi.tokenize_n_best("すもももももももものうち", 2))
[[('すもも', '名詞,一般,*,*,*,*,すもも,スモモ,スモモ'),
  ('', '助詞,係助詞,*,*,*,*,,,'),
  ('もも', '名詞,一般,*,*,*,*,もも,モモ,モモ'),
  ('', '助詞,係助詞,*,*,*,*,,,'),
  ('もも', '名詞,一般,*,*,*,*,もも,モモ,モモ'),
  ('', '助詞,連体化,*,*,*,*,,,'),
  ('うち', '名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ')],
 [('すもも', '名詞,一般,*,*,*,*,すもも,スモモ,スモモ'),
  ('', '助詞,係助詞,*,*,*,*,,,'),
  ('もも', '名詞,一般,*,*,*,*,もも,モモ,モモ'),
  ('もも', '名詞,一般,*,*,*,*,もも,モモ,モモ'),
  ('', '助詞,係助詞,*,*,*,*,,,'),
  ('', '助詞,連体化,*,*,*,*,,,'),
  ('うち', '名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ')]]
>>>

依赖

~6.5MB
~107K SLoC