##ngrams

  1. creature_feature

    可组合的 n-gram 组合器,既方便使用又速度快

    v0.1.7 #ngrams #nlp #combinator #composable #bare-metal #features #creature
  2. wimbd

    一个用于检查和分析大型文本数据集的 CLI 工具

    v0.3.0 320 #dataset #numbers #cli #ngrams #analyzing #data-processing #big-data
  3. natural

    用于自然语言处理的纯 Rust 库

    v0.5.0 1.2K #nlp #processing #language #ngrams #levenshtein #classification #distance
  4. n_gram

    训练 n-gram 语言模型

    v0.1.12 #ngrams #n-grams #lm #simple
  5. angr

    分析文本文件中的 n-gram

    v0.1.0 #ngrams #optimization #frequency #command-line-tool #analysis #data #analyzing
  6. tiniestsegmenter

    紧凑的日语分词器

    v0.2.0 #nlp #japanese #tokenizer #ngrams
  7. ngrammatic

    面向字符的 n-gram 生成器和模糊匹配库

    v0.4.0 140 #fuzzy-matching #ngrams #fuzzy #string-similarity #shingles
  8. tokengrams

    计算 n-gram 统计数据,并在预分词的文本语料库上构建语言模型

    v0.3.0 #language-model #n-grams #array-index #suffix-array #pyo3 #compute #python-bindings
  9. tongrams

    大量的 N-grams

    v0.1.4 #nlp #n-grams #ngrams #language-model #trie #compression
  10. ngram

    n-gram 和 k-skip-n-gram 的迭代器适配器

    v0.1.13 #ngrams #skip #skip-gram #gram #n
  11. textcat

    检测文本类别。它可以用来检测给定文本的语言

    v0.3.2 #text #ngrams #detect #language #category #extract #sample
  12. ngram-search

    基于 n-gram 的字符串索引到二进制文件

    v0.1.1 #ngrams #index #indexing #text-search #full-text #write-file #binary-file
  13. ngrams

    从序列生成n-gram

    v1.0.1 1.5K #generate #sequence #ngrams #vec
  14. schindel

    rust min-shingle 哈希

    v0.1.0 #hashing #ngrams #fuzzy #shingles #minshingle
  15. ngram_iter

    Rust Copy类型任意N-gram的迭代器

    v0.1.0 #ngrams #iterator #copy #types #str #word #options
  16. noodler

    将python-ngram项目移植过来,提供基于N-gram的模糊搜索

    v0.1.0 #ngrams #fuzzy-search #fuzzy #shingles
  17. corpus-count

    用于统计语料库中单词和字符n-gram的工具

    v0.1.1 #ngrams #count #corpus #n-grams
  18. 尝试使用DuckDuckGo进行搜索 搜索.

  19. fingles

    基于哈希的文本相似性分析

    v0.1.0 #hashing #fuzzy #ngrams #shingles
  20. shingles

    在rust中

    v0.1.1 850 #fuzzy #ngrams #slice #string #utf-8 #2d
  21. histongram

    一个用于计数n-gram的小型crate

    v0.2.0 #ngrams #counting #count #numbers
  22. naro

    全文搜索

    v0.0.1 #full-text-search #fields #ngrams
  23. grep-index

    建设中

    v0.0.1 #ngrams #grep #regex #index #search-index #search