开源运维监控系统Vigilix:整合Zabbix告警+自动化巡检,支持邮件/钉钉/企业微信/短信推送
Vigilix 项目是一个具备多组件、多功能的系统,主要用于自动巡检、系统监控、数据推送以及告警处理等。该项目包含客户端、推送端、代理端和服务端等多个模块,各模块协同工作,实现系统信息的采集、处理和通知功能。同时,项目还集成了 Zabbix 告警、巡检表格生成等特色功能,为运维人员提供全面的系统监控解决方案。
开源运维利器!Vigilix:轻量级智能监控告警系统,整合Zabbix+自动化巡检
Zabbix告警+Excel巡检?这工具让我每天早下班2小时!
项目地址
🔥 Gitee:https://gitee.com/Xi_Tong/vigilix
🔥 GitHub:https://github.com/W-XiTonG/Vigilix
一、为什么需要Vigilix?
运维日常三大痛点:
1️⃣ 监控分散:Zabbix/Prometheus等工具告警独立,通知渠道碎片化
2️⃣ 巡检低效:手动登录服务器抄指标,Excel整理耗时易出错
3️⃣ 响应延迟:告警淹没在群消息中,故障发现即是大事故
Vigilix 的解决方案:
✅ 统一告警中枢:聚合Zabbix/主机指标告警,对接10+通知渠道
✅ 自动生成巡检报告:一键触发全量采集,Excel报告自动生成
✅ 轻量级架构:Go语言开发,单节点支持千级主机监控
二、核心功能演示(附真实场景截图)
1️⃣ Zabbix告警智能集成
# 配置示例(server/config.yaml)
ZabbixAlarm:
Status: true
ZabbixURL: "http://zabbix.example.com"
ZabbixUser: "admin"
GetIntervalMin: 30s # 秒级获取新告警
自动状态比对:识别新增/恢复的告警事件
Token自动续期:无需人工干预API会话
多维度关联:告警关联主机/IP/分区信息
例如:
2️⃣ 巡检报告一键生成
# 触发全量采集
curl http://Server_IP:端口/CollectInformation
# 指定 agent 采集,例如采集ID为1和2:
curl http://Server_IP:端口/CollectInformation?clientID=1&clientID=2
生成的Excel报告包含:
-
CPU/内存/磁盘历史趋势
-
关键指标TOP10排名
-
告警事件汇总统计表
例如:
3️⃣ 多通道告警推送
# 推送端配置(push/config.yaml)
EnterpriseWeChat:
WebhookURL: "https://qyapi.weixin.qq.com/webhook/xxx"
MentionedMobileList: ["188xxxx1234"] # 定向@责任人
DingDing:
Secret: "SECxxxx"
Message: "{{.HostName}} CPU使用率{{.Current}}%超标!" # 动态模板
支持通道:
📧 邮件(含抄送列表)
💬 钉钉
📱 企业微信(精准@责任人)
✉️ 短信(SGIP协议)
三、技术架构亮点
模块化设计
| 模块 | **职责 ** | 技术栈 |
|---|---|---|
| Agent | 秒级采集主机指标 | gopsutil + WebSocket |
| Server | 告警分析/存储/Zabbix对接 | sqlx + excelize |
| Push | 高并发消息推送(10w+/秒) | 协程池+队列控制 |
| Client | WebSocket交互式控制台 | gorilla/websocket |
性能优化实践
- 动态协程池:根据CPU核心数自动调整Worker数量
// Push模块并发控制
MaxWorkers: runtime.NumCPU() * 3 // I/O密集型优化
QueueSize: 100000 // 抗突发流量
-
内存缓存:数据库宕机时数据不丢失
-
增量同步:Zabbix API只拉取变更触发器
四、快速入门指南
1. 部署步骤
# 启动服务端(需提前配置config.yaml)
./vigilix-server
# 部署Agent到目标主机
./vigilix-agent -config agent-config.yaml
# 启动推送网关
./vigilix-push
2. 关键配置说明
# 告警阈值设置(Agent端)
Alarm:
Threshold: 85.0 # CPU/内存阈值
NetworkCard: "eth0" # 监控网卡
CheckInterval: 15s # 采集频率
# 数据库容灾配置:数据库宕机不影响服务运行(Server端)
Database:
DatabasePass: "safe@123"
DatabaseParameter: "charset=utf8mb4&autoReconnect=true"
五、适用场景
🔍 中小团队运维监控:替代笨重的商业监控方案
🚨 告警统一管理:整合Zabbix/云监控/自建系统
🧾 合规性巡检:自动生成等保/合规巡检报告
🖥 分布式系统监控:支持跨地域主机统一管控
六、项目持续迭代中
📅 近期规划:
Prometheus指标接入
容器化部署支持(Helm Chart)
中文告警语音推送
欢迎贡献!👨💻
💌 联系邮箱:15550151751@163.com
🛠 Issue提交:Gitee/Github项目页
如果您的团队正在被碎片化监控困扰,不妨花5分钟部署体验(如有疑问请联系作者):
项目地址:见文章开头。
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐



所有评论(0)