#unicode-normalization

  1. unicode-normalization

    用于规范化 Unicode 字符串的函数,包括规范分解和兼容分解以及重组,如 Unicode 标准附件 #15 所述

    v0.1.23 9.0M #unicode #decomposition #normalization #unicode-characters #recomposition #text
  2. 分词器

    今天最常用的分词器,注重性能和多功能性

    v0.20.0 90K #nlp #tokenizer #huggingface #bpe #word-piece #unicode-normalization #tokenize
  3. icu_normalizer

    将文本规范化为 Unicode 规范化形式的 API

    v1.5.0 263K #unicode-normalization #decomposition #character #internationalization #normalizer #localization #utf-8
  4. any_ascii

    Unicode 到 ASCII 转写

    v0.3.2 137K #unicode-characters #ascii #unicode #transliteration #emoji #unicode-normalization #unidecode
  5. detone

    分解越南语声调符号

    v1.0.1 30K #vietnamese #unicode #unicode-normalization #tone #marks #forms #iterator
  6. unic-ucd-ident

    UNIC — Unicode 字符数据库 — 标识符属性

    v0.9.0 120K #unicode #unicode-normalization #unicode-text #character-property
  7. unic-ucd-normal

    UNIC — Unicode 字符数据库 — 规范化属性

    v0.9.0 8.9K #unicode-normalization #unicode #normalization #unicode-text
  8. unicode-normalization-alignments

    用于规范化 Unicode 字符串的函数,包括规范分解和兼容分解以及重组,如 Unicode 标准附件 #15 所述

    v0.1.12 135K #unicode-normalization #unicode #normalization #unicode-characters #decomposition #unicode-text #recomposition
  9. seshat-unicode

    Rust 的 Unicode 库。Unicode 15.1.0 已准备好。XID_Start 和 XID_Continue 也可用。

    v0.2.1 100 #unicode #unicode-characters #unicode-normalization #properties #character #seshat #standard
  10. secular

    无变音符号!

    v1.0.1 1.7K #unicode-normalization #unicode #normalization #diacritics
  11. utf8-norm

    命令行工具,用于验证和标准化UTF-8数据

    v1.1.1 #unicode-normalization #unicode #normalize #localization #command-line #command-line-tool
  12. unic-normal

    UNIC — Unicode标准化形式

    v0.9.0 8.3K #unicode-normalization #unicode #normalization #decomposition #unicode-text #recomposition #text
  13. hfs_nfd

    在Rust中处理苹果独特的类似NFD的Unicode标准化,用于HFS+

    v2.0.0 #unicode-normalization #normalization #unicode #apple #hfs #encoding #handle
  14. unic

    Unicode和国际化包

    v0.9.0 550 #unicode #unicode-normalization #internationalization #unicode-text #text
  15. 尝试使用DuckDuckGo搜索

  16. json-digest-wasm

    json-digest包的WebAssembly包装器

    v0.0.16 #iop #crypto #ssi #wallet #wasm #unicode-normalization