6 个版本 (3 个重大更改)

0.5.0 2022年5月15日
0.4.0 2021年7月12日
0.3.0 2021年2月4日
0.2.2 2020年5月12日

#447机器学习


4 个crate中使用(直接使用2个)

MIT/Apache

47KB
1K SLoC

Oh No! More Lemmas

ohnomore 包含两个工具,用于将 TüBa-D/Z 风格的词元纳入语言处理管道。第一个工具 ohnomore-preproc 将 TüBa-D/Z 词元转换为更适合机器学习管道的词元。例如

  • 删除了替代词元化。
  • 删除了可分离的前缀标记。
  • 当它们可分离时,删除了可分离的前缀。
  • 将特殊反身词元 #refl 替换为小写形式。
  • 将截断词元替换为其形式。

第二个工具 ohnomore 执行相反的转换(尽可能多)。

依赖关系

~5.5MB
~101K SLoC