-
icu_segmenter
Unicode行分割和文本分割算法,用于文本边界分析
-
sif-embedding
平滑逆频率(SIF),一种简单但强大的句子嵌入技术
-
arabic_reshaper
重构阿拉伯语句子,用于不支持阿拉伯语的应用程序
-
sentencepiece
sentencepiece分词器的绑定
-
punkt
句子分词器
-
pragmatic-segmenter
Rust的pySBD v3.1.0版本
-
rs-conllu
Universal Dependencies项目的CoNLL-U格式的解析器
-
match-pinyin-with-hanzi
检查汉字句子(汉字)是否与拼音句子(拼音)匹配。支持儿化音。
-
ogam
用于故事作者的标记语言
-
worcher
静态网站的全文搜索
-
rust-pinyin
将中文句子转换为拼音首字母
-
raa_tt
证明命题演算中的句子
-
摘要
提取最能总结文档的句子
-
truecase
使用统计模型恢复任意文本中的正确字母大小写
-
budoux
Rust 版 BudouX(机器学习驱动的行断句组织工具)
-
cutters
基于规则的句子分割库
-
adafruit_gps
用于 adafruit Ultimate GPS 或 Adafruit Mini GPS PA1010D 的 GPS 解析器和读取器
-
heckmv
一个基本的基于案例转换的重命名 CLI 工具
-
uindex
通用索引
-
salph
一个小工具,帮助你使用拼写字母进行拼写
-
sentence
对英语句子进行分词,用于 TTS 应用
-
cgisf_lib
一个快速简单的句子生成器
-
parattice
递归释义格生成器
-
yaksay
增强版的Cowsay
-
genere
尊重句子语法性别的文本随机化
-
english-language-parser
为KMA Rust课程创建的英语句子解析器
-
udgraph-projectivize
通用依存图的投影化/去投影化
-
caser
在PascalCase、camelCase和snake_case之间更改文本
-
buddhasay
类似于Cowsay,但带有佛像
-
deregex
显示所有可能的和最短的与给定正则表达式匹配的字符串
-
saku
高效的基于规则的日语句子分词器
-
condex
通过简单的条件表达式提取标记
-
sentence2vec
将句子转换为向量。它可以用于分割word2vec数据。它还可以用于从word2vec数据文件中提取单词列表。
-
oink
用Rust编写的Pig Latin转换器
-
conllu-utils
使用 CoNLL-U 依赖格式
-
kma-rustlang-vadym-polishchuk-english-parser
为KMA Rust课程创建的英语句子解析器
-
标记
字符串标记器(和句子分割器)注意:如果您觉得这个名字不太合适,请直接给我发邮件到jaln at itu dot dk
-
回文
检查单词和句子中的回文
-
homoglyph-core
为 homoglyph cli 和服务提供的域层。计算输入句子的同形异义字符。
-
homoglyph-service
homoglyph-cli
-
covfefify
以风格结束句子
-
homoglyphs
为给定的输入句子生成所有同形异义字符
-
extractor
实验性 API 用于提取编译器的通用错误标题
-
homoglyph-driver
homoglyph-service
尝试使用DuckDuckGo搜索。