41 个版本

0.2.3 2024 年 4 月 11 日
0.1.74 2024 年 3 月 20 日
0.1.73 2024 年 1 月 13 日

#407#yaml

Download history 5/week @ 2024-05-21 3/week @ 2024-06-11

每月 2,495 次下载
aliver 中使用

Apache-2.0

37KB
840

alive : 极简主义的监控 & 状态页 (无需数据库即可部署)

截图演示

桌面

手机

设计特性

无需数据库即可部署

监控和报警都插件化

./conf/plugin.yml 可以用相对路径引用外部插件

可以用下面的方案免费部署

设计初衷

监控有很多复杂的逻辑,比如配置 orchestrator 自动切换主从的 mysql 高可用,那么应该监控 mysql 主从拓扑是不是正确,有没有脑裂。

监控和自愈应该是一体的,比如发现 IP 挂了,应该去屏蔽 cloudflare 上解析的 ip,发现恢复了,应该去启用 ip。

现在有的方案想实现我的这些需求,都太重了。

干脆自己写一个,所有的监控都插件化,按需启用

免费部署

前端部署到 cloudflare

后端部署到 fly.dev

本地运行

运行 ./sh/conf_init.sh 初始化配置

修改 ./conf/plugin.yml 启用插件

代码结构

  1. ./doc.sh 生成文档 (例如,./doc.sh alive_api)
  2. ./htm 前端
  3. [./alive_api/api.proto][./alive_api/api.proto] 后端返回数据是 protobuf 格式
  4. ./srv 后端
  5. ./srv/ssl/up.sh 后端的本地 https 代理 (开了才能配合前端调试)
  6. ./watch 监控插件
  7. ./new.watch.sh xxx 新建监控插件
  8. ./alter 报警插件
  9. ./new.alter.sh xxx 新建报警插件
  10. ./sh/conf_example.sh 从实际的配置导出演示的配置文件

后续计划

后续计划暂无排期,只是备忘

  • 基于报警插件,可以对接后端数据库,持久化报警日志
  • 现在后端返回的数据有 runed, cost_sum , avg10 ,可以用展示监控服务访问延时的变化,但是前端没做展示(可以在服务延时异常的时候显示前端警告)

依赖

~12–22MB
~305K SLoC