#规范化 #UTF-8 #越南文 #locdau

bin+lib tb_规范化

一个用于规范化 utf8 字符串、越南文 loc dau 以及某些语言的库

2 个版本 (1 个稳定版)

1.0.0 2021年2月1日
0.9.9 2021年2月1日

#1543文本处理

自定义许可证

5KB
69

UTF8Normalizer

extern crate tb_normalization;
use tb_normalization::unicode::TbNormalization;

fn main() {
  let s = "số 22 ngách 63/30/16 lê đức thọ , mỹ đình 2  Được chưa nhỉ  --";
  println!("{}", s.tb_normalization());
  println!("{}", s.remove_special_characters());
}

依赖项

~2.7–4MB
~93K SLoC