#nlp

  1. tokenizers

    今天最常用的分词器,重点关注性能和多功能性

    v0.20.0 101K #nlp #tokenizer #huggingface #bpe #word-piece #unicode-normalization #tokenize
  2. fluent

    一种旨在释放自然语言翻译全部表达能力的本地化系统

    v0.16.1 91K #nlp #localization #internationalization #i18n #intl
  3. rust-stemmers

    一些流行的snowball词干提取算法

    v1.2.0 509K #nlp #information-retrieval #stemming #language #retrieval
  4. whatlang

    Rust的快速轻量级语言识别库

    v0.16.4 17K #nlp #language-detection #language #scripting-language #text #classification
  5. text-splitter

    将文本分割成语义块,最多到所需块大小。支持按字符和标记计算长度,并可从Rust和Python调用。

    v0.15.0 11K #split #nlp #tokenizer #ai #language-model #text
  6. lngcnv

    语言学:显示发音,方言之间翻译,正字法转换;支持多种语言:英语、拉丁语、波兰语、克丘亚语、西班牙语、提库纳语

    v1.10.0 350 #phonetic #linguistics #speech #spelling #text-processing #nlp #command-line
  7. lingua

    一个准确的自然语言检测库,适用于短文本和混合语言文本

    v1.6.2 6.7K #nlp #language-detection #text-processing #language-recognition
  8. human_name

    解析和比较人名

    v2.0.3 91K #name #nlp #human #language
  9. rust-bert

    预制的NLP管道和语言模型

    v0.22.0 2.9K #language-model #nlp #transformer #deep-learning #text-generation #translation #machine-learning
  10. rustfst

    构建、组合、优化和搜索加权有限状态转换器(FSTs)

    v1.1.2 22K #fst #transducer #acceptor #graph #shortest-path #nlp
  11. jieba-rs

    使用 Rust 实现的 Jieba 中文分词

    v0.7.0 22K #nlp #chinese #segmenation
  12. parol

    Rust 的 LL(k) 和 LALR(1) 解析生成器

    v0.31.0 360 #parser-generator #lalr-parser #parser #nlp #parsing #l-lk #command-line-tool
  13. picovoice

    为 Picovoice 语音识别平台提供的 Rust SDK

    v3.0.3 150 #speech-recognition #nlp #voice-recognition #voice-control #wake-word #natural-language
  14. stam

    处理文本离线标注的强大库。这是一个 Rust 库。

    v0.14.2 210 #annotations #annotation #nlp #linguistics #query-language #text-processing #data-model
  15. aws-sdk-connectcontactlens

    AWS SDK for Amazon Connect Contact Lens

    v1.40.0 600 #nlp #aws-sdk #contact #lens #connect #amazon #processing
  16. google-language1-cli

    用于与云自然语言(协议 v1)交互的完整库

    v5.0.4+20240303 250 #nlp #google-cloud #language #google-api #language #command-line-interface
  17. google-language1_beta1-cli

    用于与云自然语言(协议 v1beta1)交互的完整库

    v5.0.4+20220218 210 #nlp #google-cloud #language #google-api #language #command-line-interface
  18. chamkho

    高棉语、老挝语、缅甸语和泰语分词库和命令行

    v1.4.3 210 #nlp #thai #text #command-line #library
  19. vrl

    向量重映射语言

    v0.17.0 12K #scripting-language #datadog #compiler #syntax-tree #query-language #ast #nlp
  20. pv_rhino

    Picovoice 的 Rhino 库的绑定

    v3.0.3 600 #nlp #speech-recognition #voice-command #speech-to-intent #voice-control #awake-word #natural-language
  21. pv_leopard

    Picovoice 的 Leopard 库的绑定

    v2.0.2 120 #语音识别 #语音转文本 #leopard #picovoice #nlp #engine #音频处理
  22. 关键字提取

    从文本中提取关键字的算法集合

    v1.4.3 #nlp #extract #algorithm #document #language #extracting #words
  23. shellchat

    将自然语言转换为可执行或解释的shell命令

    v1.0.18 2.0K #ChatGPT #gpt #llm #nlp #copilot #cli
  24. aws-sdk-qconnect

    Amazon Q Connect的AWS SDK

    v1.42.0 550 #知识库 #aws-sdk #amazon #connect #nlp #response #content
  25. fluent-syntax

    Fluent语法的解析/序列化工具

    v0.11.1 160K #本地化 #国际化 #intl #nlp
  26. vidyut-prakriya

    梵文单词生成器

    v0.1.0 #rules #nlp #sanskrit #word #prakriya #grammar #derivation
  27. rust_tokenizers

    Rust的高性能分词器

    v8.1.1 4.3K #tokenizer #nlp #tokenize #machine-learning #language-model
  28. analiticcl

    近似字符串匹配或模糊匹配系统,可用于查找拼写校正或文本归一化的变体

    v0.4.6 750 #string-matching #spelling-correction #nlp #edit-distance #linguistics #text-input #spell-checking
  29. creature_feature

    可组合的n-gram组合器,既易于使用又非常快速

    v0.1.7 #ngrams #nlp #combinator #composable #bare-metal #features #creature
  30. stam-tools

    用于在文本上处理离线注释(STAM)的命令行工具

    v0.7.4 300 #nlp #annotations #annotation #linguistics #standoff #text-processing
  31. wordcut-engine

    词分割/断句库

    v1.1.9 #nlp #library #text
  32. text_analysis

    分析存储在提供的文件或目录中的*.txt文本。不读取子目录中的文件。统计所有单词,然后在附近(+-5个单词)中搜索每个唯一的单词…

    v0.3.4 240 #text-parser #statistics #nlp #txt-file #parser #search #science
  33. fluent-bundle

    一种旨在释放自然语言翻译全部表达能力的本地化系统

    v0.15.3 160K #localization #nlp #internationalization #intl #l10n
  34. two_timer

    英文时间表达式的解析器

    v2.2.5 #nlp #parse #time-parser #expression-parser #parser #time
  35. in_definite

    获取与给定单词匹配的不定冠词('a' 或 'an')。例如:an umbrella,a user。

    v1.0.0 4.2K #nlp #grammar #english #text
  36. tod

    一个微型的非官方 Todoist 客户端

    v0.6.12 180 #todoist #tasks #task #client #command-line-tool #todo #nlp
  37. text2num

    解析并将用英语、荷兰语、西班牙语、德语、意大利语或法语书写的数字转换为它们的数字表示

    v2.5.0 140 #nlp #numbers #language #english #french #spanish #digits
  38. stam-python

    STAM 是一个处理文本上 standoff 注释的库,这是 Python 绑定

    v0.8.4 170 #nlp #annotations #annotation #python-bindings #linguistics #data-model #standoff
  39. gpt-cli

    使用自然语言运行 Linux 命令。例如:'show my graphic card' 而不是 'lspci | grep VGA'

    v0.0.20 120 #linux-command #nlp #gpt3 #openai #gpt-3 #linux-terminal #gpt3-cli
  40. matcher_py

    一个高性能的匹配器,旨在解决单词匹配中的逻辑和文本变化问题,使用 Rust 实现

    v0.5.4 650 #string #pattern #multi #string-search #nlp #search-pattern #search
  41. kalosm

    预训练 AI 模型的接口

    v0.3.2 140 #nlp #whisper #text-generation #llm #llama #language-model #ocr
  42. stop-words

    许多语言中的常用停用词

    v0.8.0 800 #nlp #language #text #text-processing #word-list #languages #localization
  43. ultra-nlp

    一个 NLP 库

    v0.8.0 #nlp #chinese #unmatched #chars #keep
  44. RustGLM

    使用Rust语言实现的性能可靠的高性能智谱ChatGLM SDK自然语言处理

    v0.1.4 250 #rustglm #nlp #sdk #ai #zhipu #ChatGLM #http
  45. eliza

    约瑟夫·魏森鲍姆于1966年开发的自然语言处理程序

    v2.0.1 #nlp #chat-bot #linguistics #weizenbaum #pattern-matching #artificial-intelligence #user-input
  46. lexmatch

    给定一个词汇表,该工具识别目标文本中所有匹配项的词汇匹配工具。使用后缀数组。

    v0.3.0 #suffix-array #text #nlp #text-processing #lexicon #matching #target
  47. musicgpt

    使用本地运行的LLM根据自然语言提示生成音乐

    v0.3.3 #nlp #music #llm #ai #audio
  48. llm_utils

    LLM瑞士军刀:无链条 - 只提供工具

    v0.0.7 #llm #nlp #tokenizer #chunking #hugging-face #gguf #prompt-tokens
  49. ltp

    Rust的语料库技术平台

    v0.1.9 #nlp #language-technology #platform #rust
  50. huggingface/tokenizers-python

    💥 为研究和生产优化的最新一代快速状态 tokenizer

    GitHub 0.16.0-dev.0 #tokenize #nlp #production #research #bert #bpe #gpt
  51. rsllm

    Rust AI流分析器Twitch机器人

    v0.6.2 170 #ai #twitch #text-to-speech #ndi #nlp #stable-diffusion #language-model
  52. dragon_db

    一个用于RAG的嵌入数据库,带有辅助函数

    v0.10.1 1.4K #vector-database #embedding #database #machine-learning #nearest-neighbor #nlp #file-format
  53. valentinus

    使用LMDB绑定构建的下一代向量数据库

    v0.4.1 1.2K #vector-database #nlp #deep-learning #machine-learning #transformer
  54. instant-segment

    快速的英文单词分词

    v0.11.0 #nlp #english-words #word #language #segmentation #segment #instant
  55. kalosm-language

    一组预训练的语言模型

    v0.3.2 #language-model #nlp #ai #llm #llama #mistral
  56. hiramu-cli

    一种用于与 AWS Bedrock 上的大型语言模型 (LLM) 交互并基于提示生成文本的命令行界面工具

    v0.1.23 280 #language-model #generate #text #nlp #prompt #bedrock #text-input
  57. kathoey

    使用开放语料库语言学数据进行的文本女性化

    v1.1.5 #nlp #text #russian #xml-parser #bincode #data #binary-format
  58. drug-extraction-cli

    用于从文本记录中提取药物的 CLI 工具

    v1.3.0 #nlp #string-similarity #extract #text #text-parser #drug #search-algorithms
  59. cmdo-gen

    使用自然语言生成终端命令的脚本

    v0.2.2 370 #nlp #openai-api #command #terminal #generate #natural #language
  60. vidyut-lipi

    梵文转写器

    v0.1.0 #language #scheme #sanskrit #script #nlp #transliteration #convert
  61. fluent-pseudo

    用于 Project Fluent API 的伪本地化转换 API

    v0.3.2 2.9K #localization #internationalization #intl #nlp
  62. txtai

    txtai 的 Rust 客户端

    v7.3.0 110 #nlp #machine-learning #search #similarity #api-bindings #language-model #api-client
  63. kalosm-sample

    用于标记采样和结构化 LLM 采样的通用接口

    v0.3.2 340 #nlp #llm #ai #mistral #llama #helper #text-generation
  64. langit

    一种简单的语言检测器

    v0.1.1 #nlp #language #detector #languages
  65. sif-embedding

    平滑逆频率 (SIF),一种简单但强大的句子嵌入技术

    v0.6.1 #nlp #embedding #sentence #sif #sentence-embeddings #algorithm #model
  66. rust_readability

    使用各种可读性公式评估文本复杂性的包

    v0.2.0 160 #readability #nlp #text #index #complexity #automated #formulas
  67. 自然语言处理

    纯Rust编写的自然语言处理库

    v0.5.0 1.2K #nlp #processing #language #ngrams #levenshtein #classification #distance
  68. kanpyo

    日语词法分析器

    v0.1.1 #japanese-morphological #analyzer #japanese #morphological #nlp
  69. 关键词

    Rust编写的快速自动关键词提取(RAKE)实现

    v0.3.3 280 #nlp #extract #rake #extraction #keyword
  70. date_time_parser

    Rust编写的NLP库,用于将英语自然语言解析为日期和时间

    v0.2.0 1.4K #nlp #date-time #english #time-parser #language #events #natural
  71. hyphertool

    Hypertool是一个用于音节分割和连字符化的命令行工具

    v0.2.0 #nlp #command-line-tool #language #hyphenation #syllable #syllabification #rules
  72. fluent-testing

    为fluent-rs组件测试提供的模拟场景集合

    v0.0.4 #localization #internationalization #nlp #intl
  73. natural_syntax

    自然语言语法高亮显示

    v0.0.2 340 #syntax-highlighting #nlp #language #natural #speech #part #prediction
  74. tfidf-text-summarizer

    一种基于TF-IDF分数的提取性文本摘要系统,用于对句子进行排序并生成摘要

    v0.0.3 #nlp #tf-idf #text-summarization
  75. ferret

    一种基于三元组的工具,用于检测文本文档或程序代码组中的相似性

    v1.1.1 #similarity #nlp #text-document #programming-language #collusion #plagiarism #duplicates
  76. flashtext2

    FlashText算法在Rust中的实现

    v0.2.0 300 #nlp #string #extract #trie #string-matching #replace #standard
  77. commit_crafter

    Git提交信息生成器的AI工具

    v0.1.4 140 #git-commit #commit-message #git #ai #productivity #nlp #openai-api
  78. reinfer-client

    Re:infer的API客户端,对话数据智能平台

    v0.31.0 480 #nlp #machine-learning #api-client #data #intelligence #platform #re-infer
  79. furze

    用Rust编写的有限状态转换器(fst)

    v0.1.0 100 #search-engine #finite-state #fst #nlp #speech-recognition #transducer #natural
  80. pragmatic-segmenter

    Rust的pySBD v3.1.0版本

    v0.1.3 #nlp #sentence #segmentation #boundary #sbd #regular-expressions
  81. sbert

    句子Bert(SBert)

    v0.4.1 #nlp #transformer #bert #embedding #hugging-face #transformers
  82. kalosm-language-model

    语言模型/转换器的通用接口

    v0.3.2 430 #language-model #nlp #llm #ai #llama #mistral
  83. treebender

    受HDPSG启发的Rust符号NLP库

    v0.1.1 #nlp #syntax-tree #parser #syntax #earley #hdpsg #parsing
  84. yozuk

    程序员聊天机器人

    v0.22.11 370 #chat-bot #nlp #programmers #telegram-bot #machine-learning #calculations #tasks
  85. tu

    将自然语言日期/时间字符串转换为UTC的CLI工具

    v0.2.0 #nlp #utc #date-time #time #date #cli
  86. clarifai_grpc

    Clarifai官方gRPC Rust客户端

    v8.0.0 #grpc-client #clarifai #ai #deep-learning #neural-network #nlp #computer-vision
  87. ai-agents

    专为构建和管理生成式AI代理而设计,利用大型语言模型(LLM)的能力

    v0.2.3 #generative-ai #language-model #ai #llm #generative #agent #nlp
  88. sentencepiece-model

    从SentencePiece protobuf定义生成的SentencePiece模型解析器

    v0.1.3 110 #nlp #sentence-piece #machine-learning #tokenizer #sentencepiece
  89. ungoliant

    OSCAR语料库的管道

    v2.0.0 #nlp #language #pipeline #corpus #generation #common-crawl #generate
  90. selmr

    用于创建和使用简单可解释语言多重集合表示的包

    v0.4.0 120 #nlp #language-model #representation #multiset #structures #embedding #explainable
  91. token-counter

    wc 用于词元:使用 HF Tokenizers 统计文件中的词元数量

    v0.1.0 #nlp #tokenizer #command-line-tool #cli
  92. wordshk_tools

    words.hk (粵典) 的解析器和其他工具的组合

    v3.16.0-beta.9 180 #nlp #dictionary #parser-combinator #cantonese #csv #data-processing
  93. wit_owo

    最后,Rust 中 wit.ai 的合适库

    v0.1.8 #nlp #language #wit #natural #ai-api #access #owo
  94. tiniestsegmenter

    紧凑的日语分词器

    v0.2.0 #nlp #japanese #tokenizer #ngrams #ngram
  95. seal

    Needleman-Wunsch & Smith-Waterman 序列比对

    v0.1.5 430 #sequence-alignment #nlp #needleman-wunsch #dna #smith-waterman
  96. syllarust

    快速统计音节

    v0.1.1 #nlp #syllable #language #language-model #text-processing #text
  97. cephalon

    从文档中提取信息,并将其输入到向量数据库以创建强大的知识库助手

    v0.0.10 #machine-learning #framework #applications #nlp #computer-vision #vector-database #search-index
  98. gpt_text

    openai 文本包装器,仅封装一个级别的函数

    v0.1.7 #nlp #generative-ai #openai #generative #ai
  99. nlpo3

    泰语自然语言处理库,具有 Python 和 Node 绑定

    v1.3.2 #nlp #thai #tokenizer #python-bindings #word-segmentation #nodejs
  100. ayda

    询问你的文档任何问题。一个用于使用大型语言模型查询文档的工具。

    v1.1.1 #language-model #nlp #search #pdf #openai #academic #cli
  101. rbert

    Bert 嵌入的接口

    v0.3.3 410 #bert #transformer #ai #llm #nlp #language-model #transformers
  102. kalosm-llama

    为Llama模型提供的接口

    v0.3.3 290 #nlp #language-model #llama #llm #mistral #agents #artificial-intelligence
  103. rphi

    为Phi模型提供的接口

    v0.3.2 130 #nlp #candle #ai #llm #phi #language-model
  104. kalosm-learning

    用于构建基于预训练模型的一个简化机器学习库

    v0.3.2 #machine-learning #ai #bert #transformer #nlp
  105. isixhosa

    帮助处理isiXhosa文本

    v0.2.0 160 #nlp #language #xhosa #text #process #repr #noun-class
  106. flesh-reading-ease

    计算给定文本和语言的Flesh阅读难度

    v0.1.0 110 #language #readability #flesh #textanalysis #nlp
  107. lix-score

    计算给定文本和语言的LIX评分

    v0.1.0 110 #language #readability #nlp #lix #textanalysis
  108. tokenizations

    对齐库

    v0.4.2 850 #nlp #text #algorithm #token
  109. aimo

    另一个[ai]模型编排器

    v0.1.12 #nlp #command-line #ai #language #natural #command-line-tool #platform
  110. wit_ai_rs

    与wit.ai API交互的非官方Rust crate

    v0.2.0 #nlp #ai-api #wit #wit-ai #witai
  111. uniquewords-rs

    统计文本文件(s)中单词的频率

    v0.8.0 #nlp #text-file #word #frequencies #data #preprocessor #txt
  112. postagger

    受NLTK启发的词性标注器

    v0.0.3 #nlp #machine-learning #perceptron #tagging #tags #nltk
  113. nlprule

    一个快速、低资源的自然语言处理和错误纠正库

    v0.6.4 1.4K #nlp #error-correction #grammar #spelling #spelling-correction #text-processing #text
  114. korrektor

    处理乌兹别克语文本

    v0.3.1 #nlp #uzbek #language #text-processing
  115. gptshell

    开发者用于查询和交互ChatGPT语言能力的工具。GPTshell的目标是在开发过程中简化自然语言处理的使用过程。

    v0.1.11 #nlp #ChatGPT #openai #shell #cli #devex #cli-tool
  116. folia

    处理FoLiA XML格式(语言学标注格式)的高性能库

    v0.0.6 #nlp #xml-format #annotation #xml #annotations #linguistics #text-processing
  117. nlsd

    自然语言结构化文档

    v0.1.3 #nlp #parser #serde #natural-language
  118. truecase

    使用统计模型在任意文本中恢复正确的字母大小写

    v0.3.1 #nlp #statistical #restore #letter #model #casing #sentence
  119. kanji

    处理和分析日本文本,尤其是汉字

    v2.0.0 150 #japanese #japan #unicode #nlp
  120. berlin-core

    识别位置并用UN-LOCODE和ISO-3166-2子区域进行标记

    v0.2.6 150 #geospatial #nlp #search-engine #search #memory-database #string-interning
  121. textspan

    文本区间实用工具

    v0.5.2 #text #nlp #algorithm
  122. tokengeex

    基于UnigramLM和TokenMonster的高效代码分词器

    v1.1.0 130 #nlp #tokenizer #llm #codegeex #python-packages
  123. rassert

    流畅、易于扩展的测试断言库

    v1.3.0 #testing #assertions #assert #nlp #pattern-matching #tests #assertion
  124. eudex

    一个快速的音韵还原/哈希算法

    v0.1.1 1.1K #nlp #soundex #search-algorithms #language #search #dictionary
  125. fasttext-serving

    fastText模型服务API服务器

    v0.7.0 170 #nlp #serving #model #api-server #grpc #http #grpc-api
  126. polars-ai

    一个CLI和库,用于使用自然语言查询和AI与Polars DataFrame交互

    v0.0.2 #nlp #data-analysis #polars #dataframe #rust
  127. quickner-core

    快速且简单的命名实体识别工具

    v0.0.1-alpha.20 #nlp #config-file #ner #cli #named-entity
  128. layered-nlp

    高度灵活的数据导向NLP框架

    v0.1.1 #nlp #framework #grammar #wasm
  129. ragegun

    对文本执行基于词典的分析(例如,年龄、性别、PERMA、OCEAN人格特质等)

    v0.2.2 #nlp #text #traits #analysis #lexica #gender #age
  130. ohnomore

    TüBa-D/Z词元转换

    v0.5.0 #nlp #transformation #lemmas #lemmatization #machine-learning #forms #pipeline
  131. igo-rs

    纯Rust编写的Igo,日语词性标注器(日本語形態素解析)

    v0.3.0 #nlp #japanese # #wasm-binary #command-line-tool
  132. gptsh

    人工智能驱动的、新手友好的交互式shell

    v0.0.2 #nlp #shell #ChatGPT #ai #gpt #execute-command #cli
  133. myself

    构建由OpenAI语言模型驱动的对话式代理,提供简单的代理抽象以管理交互和记忆

    v0.5.0 #language-model #nlp #agent #openai #interaction #memory #abstraction
  134. chinese-ner

    用Rust编写的基于CRF的中文命名实体识别库

    v0.2.4 #chinese #nlp #ner
  135. wordfreq

    将wordfreq移植用于查找多种语言中单词的频率

    v0.2.3 #nlp #frequencies #port #words #up #language #looking
  136. str-distance

    评估字符串之间距离的距离度量

    v0.1.0 #levenshtein #string-similarity #distance #string #similarity #nlp #jaro
  137. timewarp

    用于将英语和德语自然语言解析为日期和时间的NLP库

    v0.4.0 #nlp #parser #human #human-friendly #time #parse-date
  138. vidyut-kosha

    梵文键值存储

    v0.1.0 #key-value-store #sanskrit #word #data-store #nlp #word-list #language
  139. 同音字

    大量的N-gram

    v0.1.4 #ngrams #nlp #ngram #language-model #trie #compression
  140. 一贴子

    异体字查询 获取变体汉字

    v0.1.0 #chinese #nlp #sinograph #chinese-character
  141. wordpieces

    将标记分割成单词片段

    v0.6.1 #piece #word #tokenization #wordpiece #nlp #tokenize
  142. crawdad

    字符级双数组字典

    v0.4.0 700 #trie #double-array #nlp #text #search #text-processing #structure
  143. edge-transformers

    ONNXRuntime的包装器,实现Huggingface的Optimum推理管道,并为C#和C生成绑定

    v0.1.2 #machine-learning #nlp #ai #ml #back-end
  144. cutters

    基于规则的句子分割库

    v0.1.4 #nlp #sentence #rule #parser #segmentation #language #utf-8
  145. pithy

    超快、令人毛骨悚然的任何语言的文本摘要器

    v0.1.7 #nlp #text #summarize #summarization #cli
  146. rsnltk

    基于Rust的自然语言工具包

    v0.1.3 #nlp #stanza #text-analysis #semantics #nltk #python-bindings #text-processing
  147. untanglr

    基于NLP和英语维基百科单语频率,以概率分割合并的单词

    v1.1.0 #nlp #split #words #english #string #frequencies #wikipedia
  148. bytepiece_rs

    使用Rust实现的Bytepiece标记器

    v0.2.2 #nlp #tokenizer #bytepiece #deeplearning
  149. mmseg

    Rust中的中文分词算法MMSEG

    v0.3.0 #chinese #nlp #segmenation
  150. sesdiff

    生成最短编辑脚本(Myers' diff算法),指示如何从列A中的字符串转换为列B中的字符串。还提供编辑距离(levenshtein)。

    v0.3.0 #nlp #edit-distance #linguistics #lemmatization #command-line #command-line-tool #text-processing
  151. atlatl

    双数组Trie

    v0.1.2 200 #double-array #trie #nlp #dart #transducer #tries #processing
  152. vtext

    NLP with Rust

    v0.2.0 #nlp #tokenization #python-bindings #levenshtein #machine-learning #tf-idf #tokenize
  153. openai_ChatGPT_api

    OpenAI ChatGPT API

    v0.1.2 #openai #openai-api #response #nlp #language #interface #text
  154. bleuscore

    快速Bleu评分计算器

    v0.1.3 240 #nlp #deep-learning #tokenizer #bleu #tokenize
  155. functions_ai

    LLM的字符串实现函数

    v0.1.4 #language-model #nlp #artificial-intelligence #string #proc-macro #llm #processing
  156. fast_aug

    文本的快速数据增强

    v0.1.0 #nlp #text #real-time #performance #augmentation #focus #aug
  157. wikidump

    解析MediaWiki XML导出

    v0.3.0 #nlp #mediawiki #xml-parser #processing #dump #language #natural
  158. deepfrog

    一个支持FoLiA XML的深度学习NLP套件(PoS、词元还原、NER)

    v0.2.1 #nlp #xml #annotation #annotations #linguistics #text-processing
  159. symbol-map

    值到整数标识符的内存高效映射(也称为词典或符号表),支持快速双向查找

    v1.0.2 #symbol-table #nlp #values #mapping #integer #lookup #lexicon
  160. ttaw

    对着墙壁说话,一个分块的自然语言处理库

    v0.3.0 #nlp #rhyme #cmudict #alliteration #double-metahone #cm-udict
  161. aprilasr

    使用aprilasr-sys对april-asr C API(libaprilasr)进行高级封装

    v0.2.0 #wrapper #nlp #bindings #speech-recognition #audio #neural-network
  162. gutenberg-rs

    用于从古腾堡(https://www.gutenberg.org/)获取信息和数据

    v0.1.4 #nlp #gutenberg #book #cache #scraper #textcache #machine-learning
  163. portal

    全文搜索Web服务

    v3.0.1 #text-search #full-text-search #search #nlp #jwt #web-services #search-service
  164. event_parser

    Rust自然语言处理库,用于将英文自然语言解析为iCalendar事件

    v0.1.1 #nlp #date-time #time-parser #events #english #ical #natural
  165. rnltk

    Rust自然语言处理工具包

    v0.4.0 #nlp #language #stemming #sentiment
  166. when

    'When'解析自然语言日期/时间,并生成计算机友好的输出结构

    v0.1.4 #nlp #rules #language #date-time #natural #parser #pluggable
  167. zoea

    专为婴儿级Rustaceans打造。它包含常见功能的“轻松”按钮,如HTTP GET请求、键值数据库持久化和自然语言处理。

    v0.1.0 #nlp #http-request #key-value-database #button #natural #processing #language
  168. chanoma

    字符规范化库。用于文字列正規化処理のライブラリです。

    v0.1.2 #japanese #nlp #language
  169. lingua-latvian-language-model

    Lingua的拉脱维亚语言模型,一个精确的自然语言检测库

    v1.1.0 3.9K #language-model #nlp #language-detection #language-recognition
  170. reco-forge

    自然语言驱动的推荐生成器

    v0.1.2 #recommendations #nlp #natural #language #driven #generator
  171. whichlang

    Rust的一个快速且轻量级的语言检测库

    v0.1.0 2.3K #language #nlp #text-processing
  172. rsmorphy

    俄语和乌克兰语(即将推出)的语言形态分析/屈折引擎(WIP)

    v0.4.0 #inflection #russian #nlp #ukrainian #pluralize
  173. drug-extraction-core

    从文本记录中提取药物的核心库

    v0.1.2 #extract #text #nlp #drug
  174. gecliht

    一组文本操作和格式化算法

    v0.2.0 #nlp #text-formatting #text #soundex #stemmer #format #generate
  175. aprilasr-sys

    用于April-ASR C API(libaprilasr)的低级FFI绑定

    v0.1.3 #bindings #nlp #wrapper #bindings-generator #audio #neural-network
  176. nlprule-build

    为快速、低资源自然语言处理和错误纠正库构建工具

    v0.6.4 1.2K #nlp #语法 #拼写 #错误纠正 #构建脚本 #文本处理 #拼写纠正
  177. fluent_field_assertions

    FluentFieldAssertions是一个库,允许您以类似自然语言的语法编写测试。使用此库,您可以以直观和易读的方式执行字段断言

    v0.2.0 #断言 #nlp #测试 #fluent #断言 # #结构字段
  178. yake-rust

    用Rust编写的Yake(另一种关键字提取器)

    v0.1.8 #nlp #提取器 #关键字 #服务器API
  179. siffra

    解析和评估人类友好的数学和自然语言表达式

    v0.2.2 #数学表达式 #nlp #数学 #表达式解析器 #计算器 #维度 #单位
  180. smart-date

    解析自然语言文本中的相对和绝对日期

    v0.1.1 #nlp #日期 #自然 #语言 #相对 #绝对 #文本
  181. charmap

    一至(无/一/多)字符映射

    v0.2.2 #迭代器 #nlp #无std #文本
  182. refac

    根据通用自然语言提示转换一些文本

    v0.1.2 #nlp #聊天完成 #文本 #自然 #openai-api #语言 #自动
  183. bosonnlp

    Rust的SDK

    v0.10.3 #标签 #nlp #ner #情感 #标签
  184. parattice

    递归释义格生成器

    v0.2.2 #nlp #释义 # #递归 #生成器 #句子 #短语
  185. 尝试使用DuckDuckGo进行搜索。[搜索]

  186. orphic

    为*nix系统提供自然语言接口。(由ChatGPT提供支持)

    v0.1.2 #nlp #gpt #ChatGPT #llm #执行命令 #linux #cli命令
  187. bareun_rs

    Bareun是Rust的韩语形态分析器

    v0.1.0 #韩语 #nlp #分析器 #分词器
  188. shoulds

    用于编写测试断言的直观且简单的库,以自然流畅的语言

    v0.1.6 #断言 #shouldly #nlp #断言 #测试 #测试
  189. babel

    通用自然语言处理crate,用于修剪、分词和词元化

    v0.1.1 #nlp #processing #lemmatization #tokenization #natural #language #icons
  190. chinese2digits

    中文数字到数字的最佳工具。NLP和机器人项目中的实用工具。

    v1.0.0 #numbers #chinese #digits #nlp #extract #number
  191. aiha

    🦉 AIHA 帮助您在 🤗 Hub 上找到任何模型的最低要求

    v0.0.4 #hardware #ai #hugging-face #huggingface #nlp #advisor
  192. blingfire

    BlingFire 分词库的包装器

    v1.0.0 3.4K #tokenizer #nlp #machine-learning
  193. tradukisto

    一种有用的自然语言翻译库和实用程序

    v0.1.1 #nlp #translation #utility #image #audio #copilot #localization
  194. ssam

    split sampler的简称,通过随机抽样将一个或多个基于文本的输入文件分割成多个集合。这对于将数据分割成训练、测试和开发集,或您所需的任何集合很有用。

    v0.2.0 #data-science #linguistics #nlp #text-processing
  195. rust_hero

    利用NLP增强Rust代码质量的Rust助手

    v0.5.2 #nlp #unsafe #lifetime
  196. rusty_grammar

    一种修改后的CYK算法,用于语言

    v0.1.2 #language #cnf #nlp #cyk
  197. human_language_toolkit_chatbot

    用纯Rust制作的类似NLTK的聊天机器人

    v0.1.1 #nlp #chat-bot #chatbots #hlp #artificial-intelligence #jarvis #regex
  198. lingua-english-language-model

    Lingua的英语语言模型,一个准确的自然语言检测库

    v1.1.0 7.0K #english #nlp #language-model #language-detection #language-recognition
  199. cjieba-sys

    不安全的C++jieba的FFI

    v0.1.1 #segmentation #chinese #nlp
  200. sloword2vec

    word2vec的简单实现

    v0.1.1 #nlp #linalg #word2vec
  201. lingo

    检测文本语言

    v0.2.0 #language #language-detection #nlp #detect #text #natural #stopwords
  202. libtqsm

    支持约300种语言的句子分割器

    v0.6.1 #ml #tokenization #nlp #text
  203. lingua-german-language-model

    Lingua的德语语言模型,一个准确的自然语言检测库

    v1.1.0 6.3K #nlp #language-detection #language-model #language-recognition
  204. rust_lemmatizer

    用于与词元及其对应词汇的 .csv 字典一起使用的词元化包

    v0.3.0 #csv #lemmatization #nlp #package #words #lemmatizing #txt
  205. lingua-spanish-language-model

    Lingua 的西班牙语语言模型,这是一个准确的自然语言检测库

    v1.1.0 6.2K #language-detection #nlp #language-model #language-recognition
  206. lingua-french-language-model

    Lingua 的法语语言模型,这是一个准确的自然语言检测库

    v1.1.0 6.2K #nlp #language-model #language-detection #language-recognition
  207. aleph-alpha-tokenizer

    一个基于词元化思想的快速 tokenizer 实现

    v0.3.1 #tokenizer #nlp #huggingface #alpha #aleph #rustic
  208. text-score

    ML/DL 中使用的各种度量指标实现

    v0.1.0 #nlp #metrics #evaluation #rouge #bleu
  209. vox_box

    在 Rust 中处理语音音频

    v0.3.0 #audio #fft #nlp
  210. ingreedy-rs

    ingreedy 的 Rust 版本 - 自然语言食谱成分解析器

    v0.2.0 #nlp #ingredient #recipe #parser #ingreedy
  211. lingua-portuguese-language-model

    Lingua 的葡萄牙语语言模型,这是一个准确的自然语言检测库

    v1.1.0 4.4K #nlp #language-detection #language-model #language-recognition
  212. lingua-chinese-language-model

    Lingua 的中文语言模型,这是一个准确的自然语言检测库

    v1.1.0 4.9K #nlp #language-detection #language-model #language-recognition
  213. texting

    字符串辅助函数

    v0.0.7 #nlp #string #str #helper #text
  214. lingua-ukrainian-language-model

    Lingua 的乌克兰语语言模型,这是一个准确的自然语言检测库

    v1.1.0 4.6K #nlp #language-model #language-detection #language-recognition
  215. lingua-japanese-language-model

    Lingua 的日语语言模型,这是一个准确的自然语言检测库

    v1.1.0 4.6K #japanese #nlp #language-model #language-detection #language-recognition
  216. 缩写

    在英语中展开缩写

    v0.5.4 #language #preprocessor #nlp
  217. lingua-arabic-language-model

    Lingua的阿拉伯语语言模型,一个精确的自然语言检测库

    v1.1.0 4.4K #nlp #language-model #language-detection #language-recognition #compression
  218. lingua-russian-language-model

    Lingua的俄语语言模型,一个精确的自然语言检测库

    v1.1.0 4.6K #nlp #language-detection #language-model #language-recognition
  219. lingua-italian-language-model

    Lingua的意大利语语言模型,一个精确的自然语言检测库

    v1.1.0 4.6K #nlp #language-model #language-detection #language-recognition
  220. lingua-malay-language-model

    Lingua的马来语语言模型,一个精确的自然语言检测库

    v1.1.0 4.3K #nlp #language-detection #language-model #language-recognition
  221. lingua-nynorsk-language-model

    Lingua的挪威语语言模型,一个精确的自然语言检测库

    v1.1.0 4.4K #nlp #language-model #language-detection #language-recognition
  222. lingua-turkish-language-model

    Lingua的土耳其语语言模型,一个精确的自然语言检测库

    v1.1.0 4.6K #nlp #language-model #language-detection #language-recognition
  223. lingua-thai-language-model

    Lingua的泰语语言模型,一个精确的自然语言检测库

    v1.1.0 4.3K #nlp #language-detection #language-model #language-recognition
  224. lingua-vietnamese-language-model

    Lingua的越南语语言模型,一个精确的自然语言检测库

    v1.1.0 4.5K #nlp #language-model #language-detection #language-recognition
  225. lingua-korean-language-model

    Lingua的韩语语言模型,一个精确的自然语言检测库

    v1.1.0 4.5K #language-model #nlp #language-detection #language-recognition
  226. lingua-hindi-language-model

    Lingua的印地语语言模型,一个精确的自然语言检测库

    v1.1.0 4.5K #nlp #language-model #language-detection #language-recognition
  227. witty

    wit.ai客户端库

    v1.0.0 #wit #nlp #natural #language #api-bindings #client-token