1 个不稳定版本
0.2.0 | 2023年11月10日 |
---|---|
0.1.0 |
|
#690 在 文本处理 中
52 每月下载量
130KB
1.5K SLoC
Gecliht (收集)
一组文本操作和格式化算法。
算法按照以下类别分组
- abbrev - 从一组单词中找到一个缩写词集合
- chapter_ordering - 比较字符串,就好像它们在描述一本书的章节或部分一样
- formatters - 用于排列一个或多个字符串以便输出
- metrics - 用于测量字符串对之间的相似度
- ngrams - 从单词生成ngram
- phonetics - 将名字转换为表示其声音的代码
- stemmers - 通过去除词尾将单词缩减到共同的“词干”
- stopwords - 从单词列表中移除英语停用词
MIT 许可证
版权 (c) 2020-23, Peter Lane [email protected]
在此,任何人获得本软件和相关文档文件的副本(“软件”),均免费授予在软件上不受限制的权利,包括但不限于使用、复制、修改、合并、发布、分发、再许可和/或销售软件副本的权利,并允许向软件提供者提供软件的人这样做,前提是遵守以下条件
上述版权声明和本许可声明应包含在软件的所有副本或主要部分中。
软件按“原样”提供,不提供任何形式的保证,无论是明示的还是暗示的,包括但不限于适销性、针对特定目的的适用性和非侵权性保证。在任何情况下,作者或版权所有者均不对任何索赔、损害或其他责任负责,无论是基于合同、侵权或其他方式,源于、源于或与软件或软件的使用或其他操作相关。