2个不稳定版本
0.2.0 | 2022年8月30日 |
---|---|
0.1.0 | 2022年8月9日 |
#1244 在 数据结构
22KB
444 行
Hassreden-Tracker
此仓库目前正在被用于协调Hassreden-Tracker项目的开发工作。这意味着在不久的将来,问题追踪器将是此仓库中最有趣的部分,尽管最终将会有一些代码迁移到这里。
项目
该项目基于我维护的几个现有开源项目(所有这些项目都依赖于其他开源项目)
- cancel-culture:Twitter存档、索引和屏蔽名单管理工具。
- wayback-rs:用于操作Wayback Machine的Rust库。
- twitter-watch:关于屏幕名更改和暂停的报告。
- twitter-tracker:生成twitter-watch报告的服务(目前为私有)。
- evasion:追踪极右翼规避禁令的账户。
- egg-mode-extras:用于处理Twitter API的速率限制感知异步流。
- orcrs:用于Rust的Apache ORC文件读取库。
- hkvdb:基于RocksDB构建的键值存储接口。
- twpis:Twitter个人资料图片集合。
- memory.lol:提供历史Twitter账户信息的网络服务(目前为私有)。
- stop-the-steal:与“停止偷窃”运动相关的Twitter用户的970万个人资料快照。
- octocrabby:GitHub账户的屏蔽名单管理。
原则
技术
大部分代码是用Rust编程语言编写的。我选择主要用Rust构建这个软件,有几个原因。
- Rust社区的价值观念与我的一致。
- Rust对性能的关注对资源有限的组织或个人运营的项目尤其有价值。
关于第二点:以下几乎所有工具和服务都可以在最小的、最便宜的Amazon Web Services EC2实例上有效运行,例如。
服务条款合规性
我们的目标是让上述所有项目都符合它们访问的任何平台的服务条款。
在大多数情况下,数据是从公开的公共档案和其他公共资源收集的,例如Archive Today、Wayback Machine和Internet Archive的Twitter Stream Grab。
其中一些项目会有限度地使用平台API(例如Twitter API)。这包括收集、存档和发布公开的粉丝关系、平台ID、内容状态(例如,推文是否被删除)和屏幕名。
具体来说,上述所有工具目前都不会存储通过Twitter API访问的推文。如果我们将来支持通过Twitter API存档或发布推文,我们将遵守Twitter API服务条款中的删除要求。
许可和分发
所有代码和数据都公开发布,除非这会损害核心项目目标或项目成员的隐私或安全。
大多数这些项目都是在Mozilla公共许可证下发布的。一些可能被用于商业监控的项目是在反资本主义软件许可证下发布的。
Rust库发布到广泛使用的Rust包注册库crates.io。
依赖项
~8–20MB
~309K SLoC