6 个版本
0.3.0-rc1 | 2020年4月7日 |
---|---|
0.2.0 | 2018年8月10日 |
0.1.6 | 2018年8月7日 |
0.1.4 | 2018年6月10日 |
0.1.2 | 2018年2月13日 |
#1521 in 文本处理
21KB
446 行
项目 Spacebar
基于空宽度字符的防抄袭工具。
这个工具希望最终提供一套完整的防抄袭工具。Spacebar 通过创建唯一可搜索的标签来工作,这些标签可以添加到您创建的任何文本中。这些标签在大多数编辑器中都是不可见的,并且在复制粘贴过程中持续存在,这是 Spacebar 获得其力量的地方。Spacebars 可以添加到博客文章、推文、文档、电子表格、电子邮件,甚至源代码中。几乎任何电子文本都可以添加 Spacebar。
对于这个项目的希望是提供一个集中式的 Spacebar 标签数据库,以安全可搜索的方式。用户将能够轻松创建 Spacebars 并将其添加到他们的文档中,同时管理谁使用了他们的内容以及在哪里。最终可能添加一个完整的网络爬虫,以便在用户的 Spacebar 在他们未授权的网站上被发现时提供几乎即时的通知。
创建一个标签,给它一个名称和描述。它会被添加到您的剪贴板中。将它在任何代码或文档中粘贴,无论是注释还是实际代码(如果您的编译器不关心空白字符)。
如果您以后发现文本或代码似乎被抄袭,只需将文件通过 Project Spacebar 运行,它将检查您的数据库以查看是否与您关联的 spacebar。
此软件处于早期开发阶段,存在以下问题。(带有勾选标记的项可能已被修复。)
- 数据库可能无法正确去重。
- 只有一行(例如压缩的 JSON)的文件,如果存在多个 spacebar,则可能无法找到 spacebar。
- 在创建默认 spacebar 调试字符时打印。
- 在读取文件时调用 unwrap(选项 5)会导致可处理的恐慌。它看起来很丑,但不会破坏任何东西。
- 爬虫中没有正确处理重定向。相同的 HTTP 错误。它们没有被忽略,并且被解析为所需的网页。
依赖项
~30–43MB
~736K SLoC