2个不稳定版本
0.2.0 | 2022年8月30日 |
---|---|
0.1.0 | 2022年8月9日 |
#12 in #miscellaneous
用于 2 个crate(通过 hst-tw-profiles)
7KB
Hassreden-Tracker
这个仓库目前正在被用来协调Hassreden-Tracker项目的相关工作。这意味着在近期内,这个仓库最有趣的部分将是问题跟踪器,尽管最终一些代码将迁移到这里。
项目
该项目基于我维护的几个现有开源项目(所有这些都依赖于其他开源项目)
- cancel-culture:Twitter存档、索引和封禁列表管理的工具。
- wayback-rs:用于处理Wayback Machine的Rust库。
- twitter-watch:关于用户名更改和暂停的报告。
- twitter-tracker:生成twitter-watch报告的服务(目前为私有)。
- evasion:跟踪极右翼封禁逃逸账户的报告。
- egg-mode-extras:用于处理Twitter API的速率限制感知的异步流。
- orcrs:Rust的Apache ORC文件读取库。
- hkvdb:基于RocksDB构建的键值存储接口。
- twpis:Twitter个人资料图片集合。
- memory.lol:提供历史Twitter账户信息的网络服务(目前为私有)。
- stop-the-steal:与“停止偷窃”运动相关的Twitter用户的970万个人资料快照。
- octocrabby:GitHub账户的封禁列表管理。
原则
技术
大部分代码是用Rust编程语言编写的。我选择主要使用Rust来构建这个软件,有以下几点原因
- Rust社区的价值往往与我的一致。
- Rust对性能的关注对于资源有限的组织或个人运营的项目尤其有价值。
关于第二点:几乎所有的工具和服务都可以在最小的、最便宜的Amazon Web Services EC2实例上有效运行,例如。
服务条款合规性
我们旨在使上述所有项目符合它们所访问的任何平台的《服务条款》。
在大多数情况下,数据是从公开的公共档案和其他公共资源收集的,例如 Archive Today、Wayback Machine 以及 Internet Archive 的 Twitter Stream Grab。
其中一些项目会有限度地使用平台API(例如,Twitter API)。这包括收集、存档和发布公共关注关系、平台ID、内容状态(例如,推文是否被删除)和屏幕名。
具体来说,上述工具中目前没有任何一个存储通过Twitter API访问的推文。如果我们某个时候支持通过Twitter API存档或发布推文,我们将遵守Twitter API服务条款中的删除要求。
许可和分发
所有代码和数据都公开提供,除非这样做会损害核心项目目标或项目成员的隐私或安全。
大多数这些项目都在 Mozilla Public License 下发布。一些可能被用于商业监控的项目则根据 Anti-Capitalist Software License 发布。
Rust库发布到广泛使用的Rust包注册表 crates.io。
依赖项
~1MB
~18K SLoC