9 个版本
0.1.8 | 2020 年 12 月 7 日 |
---|---|
0.1.7 | 2020 年 5 月 5 日 |
0.1.6 | 2020 年 4 月 18 日 |
0.1.3 | 2020 年 3 月 23 日 |
#1551 在 文本处理
每月 30 次下载
46KB
1K SLoC
CoNLL-U 工具
简介
这是一个处理 CoNLL-U 格式文件的实用工具集合。conllu
命令提供了以下子命令
accuracy
:根据两个语料库计算系统的准确性cleanup
:规范化 Unicode 并替换 Unicode 标点符号compare
:在单个或多个层上比较两个语料库from-text
:将分词文本文件转换为 CoNLL-U。merge
:合并 CoNLL-U 文件partition
:将 CoNLL-U 文件分割成 N 个文件。shuffle
:打乱 CoNLL-U 文件中的句子。to-text
:将 CoNLL-U 转换为分词纯文本。
用法
执行子命令时,如果提供 --help
作为参数,将提供用法信息。
依赖关系
~5–14MB
~169K SLoC