3 个不稳定版本
0.2.1 | 2020年7月31日 |
---|---|
0.2.0 | 2020年7月31日 |
0.1.0 | 2020年7月30日 |
#5 in #punctuation
38KB
698 行代码,不包括注释
huncomma
此库旨在能够检测用匈牙利语编写的文本文件中缺少的逗号。
为了始终正确地识别缺少的逗号,需要进行复杂的句子分析。本项目不旨在提供始终正确的库,也不使用上述方法。
这是一个库,如果需要可执行程序,请查看以下仓库
##警告
此库仍在开发中,其公共API可能发生变化,主分支和1.0之前的任何版本可能会有破坏性更改!
使用的方法
所提供的方法并不总是正确的,因此每个方法也返回一个浮点数,表示需要逗号的可能性,如果该方法检测到它。最终结果是这些概率的组合。
以下是用以确定可能缺少逗号的方法
通常需要逗号的词
有一些词通常需要逗号来引导
hogy
,ami
,aki
等。
如果有两个或更多的这些词连续出现,则仅第一个词前应使用逗号。
暗示从句的词对
有一些词对,当它们出现时,暗示存在一个应由逗号分隔的从句。
示例:ha ... akkor
:Ha mész vásárolni,then ne felejts el tejet hozni!(如果你去购物,别忘了买牛奶!)
通常需要逗号的词
有一些词通常需要逗号来引导
szia
,na
等。
示例:如果句子以 Na
开头,那么该词后面必须跟逗号。
Na, mondd már, hogy sikerült!
(第二个逗号存在,因为有隐含的 azt, hogy
)
通常在句子中暗示逗号的词
有一些词通常需要从句,而从句则需要逗号。
示例:单词 reméljük
大多数情况下暗示存在从句。
Reméljük, nem esett baja.
(存在隐含的 "hogy")
依赖项
~1.5MB