#url #irc #harvest #search #generate-html #irssi

bin+lib urlharvest

用于IRC irssi日志的URL收割机,无机器人

6个版本

0.5.5 2021年11月3日
0.5.4 2021年10月21日
0.5.2 2021年9月29日

#4 in #harvest

MIT/Apache

50KB
1.5K SLoC

Rust 1K SLoC // 0.0% comments Tera 355 SLoC Handlebars 75 SLoC Shell 9 SLoC // 0.2% comments

用于IRC的URL收割机,无机器人

  • 从irssi IRC客户端日志中收集URL,并插入SQLite数据库
  • 获取元数据,例如标题并更新数据库。
  • 生成HTML页面。
  • 实现搜索页面

请注意:此收割机在磁盘上跟踪您的IRC客户端(irssi)日志,且不需要或包含任何类型的ircbot。考虑在云vm上运行您的irssi以保持“始终连接” :-)

其他类型的聊天日志来源也很容易实现。基本上,聊天文本被正则表达式扫描并检测到的URL被保存并索引。

依赖项

~60MB
~1M SLoC