41 个版本
0.2.3 | 2024 年 4 月 11 日 |
---|---|
0.1.74 | 2024 年 3 月 20 日 |
0.1.73 | 2024 年 1 月 13 日 |
#407 在 #yaml
每月 2,495 次下载
在 aliver 中使用
37KB
840 行
alive : 极简主义的监控 & 状态页 (无需数据库即可部署)
截图演示
桌面
手机
设计特性
无需数据库即可部署
监控和报警都插件化
./conf/plugin.yml
可以用相对路径引用外部插件
可以用下面的方案免费部署
设计初衷
监控有很多复杂的逻辑,比如配置 orchestrator 自动切换主从的 mysql 高可用,那么应该监控 mysql 主从拓扑是不是正确,有没有脑裂。
监控和自愈应该是一体的,比如发现 IP 挂了,应该去屏蔽 cloudflare 上解析的 ip,发现恢复了,应该去启用 ip。
现在有的方案想实现我的这些需求,都太重了。
干脆自己写一个,所有的监控都插件化,按需启用
免费部署
前端部署到 cloudflare
后端部署到 fly.dev
本地运行
运行 ./sh/conf_init.sh
初始化配置
修改 ./conf/plugin.yml
启用插件
代码结构
./doc.sh
生成文档 (例如,./doc.sh alive_api
)./htm
前端- [
./alive_api/api.proto
][./alive_api/api.proto] 后端返回数据是 protobuf 格式 ./srv
后端./srv/ssl/up.sh
后端的本地 https 代理 (开了才能配合前端调试)./watch
监控插件./new.watch.sh xxx
新建监控插件./alter
报警插件./new.alter.sh xxx
新建报警插件./sh/conf_example.sh
从实际的配置导出演示的配置文件
后续计划
后续计划暂无排期,只是备忘
- 基于报警插件,可以对接后端数据库,持久化报警日志
- 现在后端返回的数据有
runed
,cost_sum
,avg10
,可以用展示监控服务访问延时的变化,但是前端没做展示(可以在服务延时异常的时候显示前端警告)
依赖
~12–22MB
~305K SLoC