6 个版本
0.1.4 | 2022 年 10 月 21 日 |
---|---|
0.1.3 | 2022 年 10 月 21 日 |
0.1.2 | 2022 年 10 月 21 日 |
0.1.1 | 2022 年 10 月 21 日 |
0.1.0 | 2022 年 10 月 21 日 |
#904 in 文本处理
33KB
778 行
wordmarkov
:author: Gustavo Ramos Rehermann :toc: :numbered
一个针对句子定制的马尔可夫链库。
此库是 Neurs 项目的一部分。
具体细节
与通用马尔可夫链不同,WordMarkov 中的马尔可夫链保留有关标点和空白的信息。
如果有不同的分隔实例,相同的两个词可以有多条边。例如,“大祭司”和“大祭司”都将导致标记“大”和“祭司”相互链接,但会有两个链接,每个链接代表一种分隔方式。
有两个特殊的标记,START
和 END
,也会发挥作用。马尔可夫链可以正向和反向遍历。在任意方向遍历时,理想情况下,在有限的时间内(遍历的单词数)都会到达特殊标记。
许可证
有关许可信息,请参阅 Neurs 项目的主仓库。
lib.rs
:
- 马尔可夫链代码。
- 主要用于 cnmc;其他项目也可以重用。
依赖关系
~315KB