1 个不稳定版本
0.1.0 | 2021年4月11日 |
---|
#1693 在 文本处理
74 每月下载量
用于 2 crates
9KB
is-vowel:启发式测试一个字符是否为元音字母
Bart Massey 2021 (版本 0.1.0)
测试罗曼语系中的元音。
判断某些图形是否为“元音”(表示“元音音素”)是语言相关的,作者不了解任何关于元音识别标准化的努力。
即使是罗曼语系,情况也有些复杂。基本的罗曼语元音是“a”、“e”、“i”、“o”、“u”。然而,例如
- 大写版本也是元音。
- 带重音的版本也是元音。
- “有时是'y',有时是'w'。”这些字母在某些情况下是辅音,在其他情况下是元音。
此代码尝试提供合理的启发式答案,以判断 Unicode 码点在罗曼语系中的“元音性”。
这里没有尝试处理非罗曼语系语言,尽管一些非罗曼语系元音字母被罗曼语系借用:例如,“æ”和“Æ”在一些英国英语中使用了。能够使用多种语言的元音字母表将是非常好的,但到目前为止,作者无法找到此类表格(令人惊讶)。
许可证
此crate在“MIT 许可证”下提供。请参阅本分发中的 LICENSE
文件以获取许可证条款。
致谢
感谢 cargo-readme
crate 为生成此 README
。
依赖项
~1MB
~40K SLoC