#markov-chain #markov #text #chat-bot #light-weight

bin+lib wordmarkov

一个简单但灵活的马尔可夫链库,专门用于文本句子,处理标点和空白

6 个版本

0.1.4 2022 年 10 月 21 日
0.1.3 2022 年 10 月 21 日
0.1.2 2022 年 10 月 21 日
0.1.1 2022 年 10 月 21 日
0.1.0 2022 年 10 月 21 日

#904 in 文本处理

自定义许可证

33KB
778

wordmarkov

:author: Gustavo Ramos Rehermann :toc: :numbered

一个针对句子定制的马尔可夫链库。

此库是 Neurs 项目的一部分。

具体细节

与通用马尔可夫链不同,WordMarkov 中的马尔可夫链保留有关标点和空白的信息。

如果有不同的分隔实例,相同的两个词可以有多条边。例如,“大祭司”和“大祭司”都将导致标记“大”和“祭司”相互链接,但会有两个链接,每个链接代表一种分隔方式。

有两个特殊的标记,STARTEND,也会发挥作用。马尔可夫链可以正向和反向遍历。在任意方向遍历时,理想情况下,在有限的时间内(遍历的单词数)都会到达特殊标记。

许可证

有关许可信息,请参阅 Neurs 项目的主仓库。


lib.rs:

  • 马尔可夫链代码。
  • 主要用于 cnmc;其他项目也可以重用。

依赖关系

~315KB