1 个不稳定版本
0.1.0 | 2022年5月17日 |
---|
#6 在 #diacritics 中
4KB
lib.rs
:
一个轻量级的库,用于从字符串中移除希伯来语标点(尼库德)。
参考: https://www.unicode.org/charts/PDF/U0590.pdf
示例
let diacrited_quoted = "״שָׁלוֹם עוֹלָם״";
// Remove only the diacritics (keep '״' chars)
let quoted = niqqud::remove(diacrited_quoted);
assert_eq!("״שלום עולם״", quoted);
// Remove diacritics and hebrew quotes (double '״' and single '׳')
let unquoted = niqqud::remove_thorough(diacrited_quoted);
assert_eq!("שלום עולם", unquoted);