#hebrew #diacritics #language #diacritics-removal

niqqud

一个轻量级的移除希伯来语标点的库

1 个不稳定版本

0.1.0 2022年5月17日

#6#diacritics

MIT 许可证

4KB

尼库德

一个轻量级的Rust库,用于从字符串中移除希伯来语标点(尼库德)。

CI LICENSE CRATES


lib.rs:

一个轻量级的库,用于从字符串中移除希伯来语标点(尼库德)。

参考: https://www.unicode.org/charts/PDF/U0590.pdf

示例

let diacrited_quoted = "״שָׁלוֹם עוֹלָם״";

// Remove only the diacritics (keep '״' chars)
let quoted = niqqud::remove(diacrited_quoted);
assert_eq!("״שלום עולם״", quoted);

// Remove diacritics and hebrew quotes (double '״' and single '׳')
let unquoted = niqqud::remove_thorough(diacrited_quoted);
assert_eq!("שלום עולם", unquoted);

无运行时依赖