1 个不稳定版本

0.2.0 2023年11月10日
0.1.0 2020年11月1日

#690文本处理

Download history 1/week @ 2024-03-10 35/week @ 2024-03-31 1/week @ 2024-04-07

52 每月下载量

MIT 许可证

130KB
1.5K SLoC

Gecliht (收集)

一组文本操作和格式化算法。

算法按照以下类别分组

  • abbrev - 从一组单词中找到一个缩写词集合
  • chapter_ordering - 比较字符串,就好像它们在描述一本书的章节或部分一样
  • formatters - 用于排列一个或多个字符串以便输出
  • metrics - 用于测量字符串对之间的相似度
  • ngrams - 从单词生成ngram
  • phonetics - 将名字转换为表示其声音的代码
  • stemmers - 通过去除词尾将单词缩减到共同的“词干”
  • stopwords - 从单词列表中移除英语停用词

MIT 许可证

版权 (c) 2020-23, Peter Lane [email protected]

在此,任何人获得本软件和相关文档文件的副本(“软件”),均免费授予在软件上不受限制的权利,包括但不限于使用、复制、修改、合并、发布、分发、再许可和/或销售软件副本的权利,并允许向软件提供者提供软件的人这样做,前提是遵守以下条件

上述版权声明和本许可声明应包含在软件的所有副本或主要部分中。

软件按“原样”提供,不提供任何形式的保证,无论是明示的还是暗示的,包括但不限于适销性、针对特定目的的适用性和非侵权性保证。在任何情况下,作者或版权所有者均不对任何索赔、损害或其他责任负责,无论是基于合同、侵权或其他方式,源于、源于或与软件或软件的使用或其他操作相关。

没有运行时依赖