#corpus

  1. cargo-test-fuzz

    v6.0.0 #fuzz-testing #cargo-test #target #corpus #test-fuzz #macro #running
  2. ungoliant

    OSCAR语料库的管道

    v2.0.0 #nlp #language #pipeline #corpus #generation #common-crawl #generate
  3. oscar-io

    OSCAR语料库的读取器/写入器

    v0.4.0 #reader-writer #corpus #oscar #processing #io #abstraction #readers-writers
  4. corpus

    中心组织,相对路径唯一性策略

    v0.2.1 #relative-path #path #file-path #relative #central #env-vars #home-directory
  5. graphannis-malloc_size_of

    从Servo代码库中fork的 malloc_size_of crate,以便将其作为依赖项提供给graphANNIS语料库搜索库

    v2.0.0 #memory #memory-size #servo #fork #codebase #corpus #search
  6. annis-web

    ANNIS语料库搜索前端实验版本

    v0.2.0 #frontend #search #annis #corpus #experimental #exporter #version
  7. conllx

    CoNLL-X依存关系的读取器/写入器

    v0.12.1 #reading #format #corpus #reader #writers #conll #treebank
  8. corpus-preproc

    文本和HTML语料库的预处理器

    v0.1.0 #preprocessor #text #corpus #cli #pre-processor #mark #modifier
  9. corpus-count

    用于统计语料库中单词和字符n-grams的工具

    v0.1.1 #ngrams #count #corpus #n-grams
  10. 尝试使用DuckDuckGo进行搜索 搜索DuckDuckGo.

  11. tanaka

    将Tanaka语料库的日英平行句子接口

    v0.1.0 #corpus #japanese #dictionary
  12. oscar-tools

    处理OSCAR语料库的工具

    v0.4.0 #corpus #oscar #txt #version #text #set #processing
  13. opus_tools

    处理OPUS平行文本语料库的杂项工具

    v0.1.3 #opus #parallel #corpus #miscellaneous #text #subtitle #raw
  14. ptb-reader

    合并的宾州树库格式解析

    v0.9.1 #nlp #corpus #parser #ptb #treebank
  15. opus-parse

    解析 OPUS

    v0.0.3 #opus #parse #xml #corpus #subtitle #monolingual #opus-tools
  16. graphannis-malloc_size_of_derive

    从 Servo 代码库中的 malloc_size_of_derive crate 分支,使其可作为依赖提供给 graphANNIS 语料库搜索库

    v2.0.0 #fork #corpus #codebase #servo #search #io #part
  17. solana_libra_fuzzer

    Solana Libra fuzzer

    v0.0.0 #libra #target #fuzzer #corpus #fuzzing #artifact #cargo