1 个不稳定版本
0.1.0 | 2021年3月4日 |
---|
#59 in #histogram
3KB
freq
一个命令行工具,用于计算输入中单词出现的次数。
目前这是一个用于功能请求和协作的占位符仓库。请创建问题来请求功能和协作。
待办事项
- 忽略单词(正则表达式模式)
- 过滤停用词(类似于NLTK的停用词)
- 不同的输出格式(纯文本,JSON)
- 性能(SIMD支持,异步执行)
- 作为库使用
- 递归支持
- 允许跳过文件
- 允许在单独的文件中指定要忽略的单词
- 为类似shell-hist的单词生成“热条”
- 能够按文件/文件夹拆分报告(类似于代码的sloc)
想法贡献者
- @jamesmunns
- 想在这里看到你的名字吗?创建一个问题!