6 个版本 (3 个重大更改)
0.5.0 | 2022年5月15日 |
---|---|
0.4.0 | 2021年7月12日 |
0.3.0 | 2021年2月4日 |
0.2.2 | 2020年5月12日 |
#447 在 机器学习
在 4 个crate中使用(直接使用2个)
47KB
1K SLoC
Oh No! More Lemmas
ohnomore 包含两个工具,用于将 TüBa-D/Z 风格的词元纳入语言处理管道。第一个工具 ohnomore-preproc
将 TüBa-D/Z 词元转换为更适合机器学习管道的词元。例如
- 删除了替代词元化。
- 删除了可分离的前缀标记。
- 当它们可分离时,删除了可分离的前缀。
- 将特殊反身词元 #refl 替换为小写形式。
- 将截断词元替换为其形式。
第二个工具 ohnomore
执行相反的转换(尽可能多)。
依赖关系
~5.5MB
~101K SLoC