#comma #hungarian #punctuation

huncomma

本项目旨在能够检测用匈牙利语编写的文本文件中缺少的逗号

3 个不稳定版本

0.2.1 2020年7月31日
0.2.0 2020年7月31日
0.1.0 2020年7月30日

#5 in #punctuation

GPL-3.0-or-later

38KB
698 行代码,不包括注释

huncomma

此库旨在能够检测用匈牙利语编写的文本文件中缺少的逗号。

为了始终正确地识别缺少的逗号,需要进行复杂的句子分析。本项目不旨在提供始终正确的库,也不使用上述方法。

这是一个库,如果需要可执行程序,请查看以下仓库

##警告

此库仍在开发中,其公共API可能发生变化,主分支和1.0之前的任何版本可能会有破坏性更改!

使用的方法

所提供的方法并不总是正确的,因此每个方法也返回一个浮点数,表示需要逗号的可能性,如果该方法检测到它。最终结果是这些概率的组合。

以下是用以确定可能缺少逗号的方法

通常需要逗号的词

有一些词通常需要逗号来引导

hogyamiaki等。

如果有两个或更多的这些词连续出现,则仅第一个词前应使用逗号。

暗示从句的词对

有一些词对,当它们出现时,暗示存在一个应由逗号分隔的从句。

示例:ha ... akkor:Ha mész vásárolni,then ne felejts el tejet hozni!(如果你去购物,别忘了买牛奶!)

通常需要逗号的词

有一些词通常需要逗号来引导

sziana等。

示例:如果句子以 Na 开头,那么该词后面必须跟逗号。

Na, mondd már, hogy sikerült!(第二个逗号存在,因为有隐含的 azt, hogy

通常在句子中暗示逗号的词

有一些词通常需要从句,而从句则需要逗号。

示例:单词 reméljük 大多数情况下暗示存在从句。

Reméljük, nem esett baja.(存在隐含的 "hogy")

依赖项

~1.5MB