6个版本
0.5.5 | 2021年11月3日 |
---|---|
0.5.4 | 2021年10月21日 |
0.5.2 | 2021年9月29日 |
#4 in #harvest
50KB
1.5K SLoC
用于IRC的URL收割机,无机器人
- 从irssi IRC客户端日志中收集URL,并插入SQLite数据库
- 获取元数据,例如标题并更新数据库。
- 生成HTML页面。
- 实现搜索页面
请注意:此收割机在磁盘上跟踪您的IRC客户端(irssi)日志,且不需要或包含任何类型的ircbot。考虑在云vm上运行您的irssi以保持“始终连接” :-)
其他类型的聊天日志来源也很容易实现。基本上,聊天文本被正则表达式扫描并检测到的URL被保存并索引。
依赖项
~60MB
~1M SLoC