1 个不稳定版本

0.12.0 2022年3月18日

#32 in #形态学

MIT许可证

20KB
167 代码行

lindera-server

一个日语形态学分析服务器。

运行服务器

% cargo run -- -H 0.0.0.0 -p=3333 -t ipadic

分词文本

% curl -XPOST -H 'Content-type: text/plain' http://localhost:3333/tokenize --data-binary 'すもももももももものうち' | jq .
[
  {
    "detail": [
      "名詞",
      "一般",
      "*",
      "*",
      "*",
      "*",
      "すもも",
      "スモモ",
      "スモモ"
    ],
    "text": "すもも"
  },
  {
    "detail": [
      "助詞",
      "係助詞",
      "*",
      "*",
      "*",
      "*",
      "",
      "",
      ""
    ],
    "text": ""
  },
  {
    "detail": [
      "名詞",
      "一般",
      "*",
      "*",
      "*",
      "*",
      "もも",
      "モモ",
      "モモ"
    ],
    "text": "もも"
  },
  {
    "detail": [
      "助詞",
      "係助詞",
      "*",
      "*",
      "*",
      "*",
      "",
      "",
      ""
    ],
    "text": ""
  },
  {
    "detail": [
      "名詞",
      "一般",
      "*",
      "*",
      "*",
      "*",
      "もも",
      "モモ",
      "モモ"
    ],
    "text": "もも"
  },
  {
    "detail": [
      "助詞",
      "連体化",
      "*",
      "*",
      "*",
      "*",
      "",
      "",
      ""
    ],
    "text": ""
  },
  {
    "detail": [
      "名詞",
      "非自立",
      "副詞可能",
      "*",
      "*",
      "*",
      "うち",
      "ウチ",
      "ウチ"
    ],
    "text": "うち"
  }
]

依赖项

~18–30MB
~425K SLoC