1 个不稳定版本

0.1.0 2021年3月4日

#59 in #histogram

Apache-2.0/MIT

3KB

freq

一个命令行工具,用于计算输入中单词出现的次数。

目前这是一个用于功能请求和协作的占位符仓库。请创建问题来请求功能和协作。

待办事项

  • 忽略单词(正则表达式模式)
  • 过滤停用词(类似于NLTK的停用词)
  • 不同的输出格式(纯文本,JSON)
  • 性能(SIMD支持,异步执行)
  • 作为库使用
  • 递归支持
  • 允许跳过文件
  • 允许在单独的文件中指定要忽略的单词
  • 为类似shell-hist的单词生成“热条”
  • 能够按文件/文件夹拆分报告(类似于代码的sloc)

想法贡献者

  • @jamesmunns
  • 想在这里看到你的名字吗?创建一个问题!

无运行时依赖