多台服务器怎么统一监控?哪吒面板部署、Agent接入与告警教程

发布时间:2026/6/30 7:54:38
多台服务器怎么统一监控?哪吒面板部署、Agent接入与告警教程 前言管理的设备一多最麻烦的不是登录服务器而是不知道应该先登录哪一台。网站响应变慢、磁盘空间不足或某台主机突然离线时如果没有统一监控往往只能逐台执行命令排查甚至要等用户反馈后才发现故障。哪吒面板采用Dashboard与Agent分离的方式。Dashboard集中展示各节点的CPU、内存、磁盘、流量和在线状态Agent安装在VPS、NAS、树莓派或其他主机中持续向管理端上报数据。再配置钉钉等通知渠道后节点离线或资源占用超过阈值时可以主动发送告警。这套方案适合个人开发者、家庭服务器用户和规模不大的运维团队。哪吒面板负责节点监控与告警cpolar用于解决Dashboard部署在家庭网络或公司内网后无法从外部访问的问题。部署过程中需要特别留意Dashboard地址、Agent通信端口和TLS设置参数不匹配时即使Agent安装过程没有报错也可能一直无法上线。1.什么是哪吒面板哪吒面板Nezha Monitoring 是一款 开源、跨平台、自托管的服务器监控与管理面板专为个人开发者、运维人员和小型团队设计用于集中监控多台服务器包括VPS、云主机、树莓派、NAS等的实时状态。主要特性功能说明多节点管理一个Dashboard管理数十台甚至上百台主机简洁 UI响应式Web界面支持暗色主题手机/PC 体验一致 实时监控CPU、内存、磁盘、带宽、在线率、进程数、负载等指标 跨平台 Agent支持 Linux、Windows、macOS、ARM树莓派、OpenWrt 等 双栈支持完美兼容IPv4 / IPv6网络环境 智能告警支持Telegram、Server、钉钉、企业微信、Bark等通知方式 自托管所有数据存储在你自己的服务器上无隐私泄露风险架构组成哪吒面板采用 “Dashboard Agent” 分离架构Dashboard控制面板运行在你的主服务器上通常是一台公网VPS提供Web界面默认端口8008存储监控数据使用SQLite或MySQLAgent客户端部署在每一台被监控的机器上可内网轻量级Go编写资源占用极低主动上报数据到Dashboard通信基于WebSocket TLS安全高效。与其他监控工具对比工具优势不足哪吒面板开源、轻量、中文友好、部署简单、支持Windows/ARM生态插件较少不适合超大规模集群Prometheus Grafana功能强大、生态丰富配置复杂学习成本高Uptime Kuma专注HTTP/端口可用性监控不提供系统级指标如CPU、内存宝塔面板集成建站监控监控功能弱非专注型工具适用场景个人用户监控家庭NAS、树莓派、博客VPS开发者跟踪测试机、数据库、API服务状态小团队统一查看所有业务服务器健康状况IPv6用户完美支持纯IPv6环境监控国内少有工具做到2.安装哪吒面板服务端2.1 环境准备首先你应当准备好一台配置不低于1核512MB内存的公网服务器这个配置可以满足大部分的使用场景。并且请提前安装好依赖unzip并提前在防火墙或者是安全策略放行8008端口否则无法访问网站以及接收相关数据安装unzipCentOS系统sudoyuminstallunzip# CentOS 7 及以下版本sudodnfinstallunzip# CentOS 8 及以上版本Ubuntu或Debian系统sudoaptupdatesudoaptinstallunzip2.2 开始安装在安装服务端的服务器上运行下面的安装脚本curl-Lhttps://raw.githubusercontent.com/nezhahq/scripts/refs/heads/main/install.sh-onezha.shchmodx nezha.shsudo./nezha.sh运行脚本后会依次提示下方信息如图所示继续操作我选择手动安装等待服务端重启完成不要关闭终端部署完成后在浏览器中输入http://IP:8008就能看到哪吒面板的界面3.哪吒面板服务端配置3.1 基础配置点击右上方的登录第一次登录的默认用户名和密码均为admin修改密码3.2 客户端详细配置看完4章教程后来配置点击编辑按钮公开备注输入下文这是默认主题{billingDataMod:{startDate:2024-12-08T12:58:17.636Z,endDate:2024-12-08T12:58:17.636Z,autoRenewal:1,cycle:Year,amount:200EUR},planDataMod:{bandwidth:30Mbps,trafficVol:1TB/Month,trafficType:2,IPv4:1,IPv6:1,networkRoute:4837,extra:Einstein}}更新完后也可以自定义字段返回前台查看变化4.客户端使用教程4.1 准备工作客户端一般安装在被检测的服务器上支持在Windows 、macOS和Linux上一键安装。安装服务端的服务器也可以安装客户端2者并不冲突客户端没啥配置要求只要能联上服务端的服务器就行。4.2 开始安装客户端打开服务器一栏点击右侧的“安装命令”并选择被检测服务器所对应的系统安装命令会自动复制到你的剪贴板上。linux举例windows举例添加完成后刷新网页被检测服务器已经自动添加成功啦你可以点击编辑按钮为其设置名称返回前台可以查看到更直观的监控随意点击一个查看它的详细信息也可以一键跳转终端4.3 客户端安装时出现的问题这是linux给的自动安装脚本很奇怪为什么我按照步骤安装且没有报错哪吒面板却没出现我的服务器修改Agent启动参数关闭TLS将你的安装/启动命令中的NZ_TLStrue改为NZ_TLSfalse哪吒Agent的NZ_TLStrue仅在服务端配置了有效TLS证书如Let’s Encrypt或自签名证书并正确加载时才使用。默认的Docker部署或二进制部署通常不包含HTTPS所以应设为false。即使你用 Nginx反向代理做了HTTPSAgent也应该连接内部HTTP地址如 127.0.0.1:8008而不是走公网HTTPS。把NZ_TLS改成false问题就能解决5.实现钉钉机器人告警5.1 获取Webhook URL创建机器人在钉钉群的设置中添加机器人选择自定义关键词方式。步骤一进入钉钉群 → 添加机器人打开钉钉 App进入你想要添加机器人的群聊。点击右上角的「…」→ 选择「群设置」。在群设置页面中找到「智能群助手」或「群机器人」选项。点击「添加机器人」。步骤二选择“自定义”机器人在添加机器人页面选择「自定义」类型也叫“Webhook”方式。填写机器人名称例如“哪吒”。选择「关键词触发」或「全部消息」根据需求设置。点击「完成」。获取Webhook URL创建完成后获得。创建完成后直接复制Webhook URL。5.2 钉钉群机器人配置示例点击展开/收起获取 URL 参数创建机器人在钉钉群的设置中添加机器人选择自定义关键词方式。获取 Webhook URL创建完成后获得。通知配置名称哪吒探针小跟班URL添加通知分组如图操作5.3 配置告警规则我这里测试的是cpu大于20%就告警[{type:cpu,max:10,duration:5,cover:0,ignore:{1:true,2:false}}]重点是一定要选择通知组这样钉钉群机器人就会在cpu20%的时候告警啦5.4 监控规则分享离线报警 规则[{Type:offline,Duration:10}]解释每10s坚持一次如果离线会发通知。CPU过高警告 规则[{type:cpu,max:90,duration:300}]解释CPU超过90%发通知警告。内存过高警告 规则[{type:memory,max:90,duration:300}]解释内存占用超过90%发通知警告300s一周期。硬盘即将爆满 规则[{type:disk,max:80,duration:43200}]解释硬盘占用超过80%发通知警告12小时一周期。6.安装cpolar实现随时随地开发你是否遇到过这样的问题我在本地或内网部署了强大的 哪吒监控面板Nezha Monitor能实时查看服务器状态、网络流量、CPU负载……但一旦离开公司/家庭网络就再也无法访问想远程排查故障却只能干着急传统方案如公网IP、DDNS、FRP、Nginx反向代理等要么成本高要么配置复杂还涉及端口暴露、安全策略、动态IP等麻烦。是时候认识 cpolar了cpolar—— 新一代内网穿透工具专为开发者与运维打造。6.1 什么是cpolarcpolar是一款安全高效的内网穿透工具无需公网IP或复杂配置只需一条命令即可将本地服务器、Web服务或任意端口映射到公网让你随时随地远程访问内网应用特别适合开发调试、远程运维和应急部署等场景。6.2 部署cpolarcpolar 可以将你本地电脑中的服务如 SSH、Web、数据库映射到公网。即使你在家里或外出时也可以通过公网地址连接回本地运行的开发环境。❤️以下是安装cpolar步骤使用一键脚本安装命令sudocurlhttps://get.cpolar.sh|sh安装完成后执行下方命令查看cpolar服务状态如图所示即为正常启动sudosystemctl status cpolarCpolar安装和成功启动服务后在浏览器上输入虚拟机主机IP加9200端口即:【http://ip:9200】访问Cpolar管理界面使用Cpolar官网注册的账号登录,登录后即可看到cpolar web 配置界面,接下来在web 界面配置即可打开浏览器访问本地9200端口使用cpolar账户密码登录即可,登录后即可对隧道进行管理。7.配置公网地址登录cpolar web UI管理界面后,点击左侧仪表盘的隧道管理——创建隧道隧道名称可自定义本例使用了:nezha注意不要与已有的隧道名称重复协议http本地地址8008域名类型随机域名地区选择China Top创建成功后打开左侧在线隧道列表,可以看到刚刚通过创建隧道生成了公网地址接下来就可以在其他电脑或者移动端设备异地上使用地址访问。访问成功。8.保留固定公网地址使用cpolar为其配置二级子域名该地址为固定地址不会随机变化。点击左侧的预留选择保留二级子域名地区选择china Top然后设置一个二级子域名名称我使用的是nezha大家可以自定义。填写备注信息点击保留。登录cpolar web UI管理界面点击左侧仪表盘的隧道管理——隧道列表找到所要配置的隧道点击右侧的编辑。修改隧道信息将保留成功的二级子域名配置到隧道中域名类型选择二级子域名Sub Domain填写保留成功的二级子域名地区: China Top点击更新更新完成后打开在线隧道列表此时可以看到随机的公网地址已经发生变化地址名称也变成了保留和固定的二级子域名名称。最后我们使用固定的公网地址在任意设备的浏览器中访问可以看到成功访问的页面这样一个永久不会变化的二级子域名公网网址即设置好了。总结哪吒面板的价值不是多展示几个资源数字而是把分散设备的运行状态集中起来并在异常真正影响业务前发出提醒。对于同时管理VPS、NAS、树莓派和测试机的用户它能够减少反复SSH检查的工作也让离线、负载和磁盘异常更容易被及时发现。原文中有几处需要在正式发布前统一正文写“CPU大于20%告警”示例规则却使用了max:10两者应保持一致NZ_TLSfalse不能作为通用解决办法是否启用TLS应以Agent实际连接的Dashboard地址和证书配置为准。此外文章前半部分要求使用公网服务器部署Dashboard后半部分又通过cpolar解决内网访问建议明确拆成“公网服务器部署”和“家庭内网部署”两种方案避免读者重复开放入口。公网使用时应立即修改默认管理员密码妥善保存Agent密钥与钉钉Webhook并限制管理后台和远程终端权限。哪吒面板适合轻量节点监控但不能完全替代日志分析、应用链路追踪和Prometheus等更完整的可观测系统。