Zabbix 无代理监控 Linux:完整指南
Zabbix 无代理监控 Linux 的逐步指南
在当今的 DevOps 工作流程中,高效监控基础设施至关重要。Zabbix 是一个强大的监控解决方案,提供基于代理和无代理的监控功能。在本文中,我们将重点介绍 Linux 系统的无代理监控,使管理员能够更轻松地跟踪性能并确保系统健康,而无需部署代理。
什么是 Zabbix 无代理监控?
无代理监控允许您在不安装 Zabbix 代理的情况下收集系统指标、日志和性能数据。相反,它使用原生协议,例如:
SSH:对于 Linux 系统,这是用于远程监控的主要协议。
SNMP:适用于网络设备和某些服务器。
IPMI:用于硬件健康监控。
HTTP/HTTPS:用于监控 Web 服务和 API。
为什么选择无代理监控?
易于设置:无需安装或配置代理。
轻量级:适用于遗留系统或具有严格合规性要求的环境。
安全性:利用现有的安全通信协议,如 SSH。
Zabbix 无代理监控 Linux 的逐步指南
步骤 -1:在目标系统上启用 SSH
要启用 SSH 监控,请确保 SSH 服务在目标 Linux 主机上运行:
允许 Zabbix 服务器连接,将其公钥添加到目标系统:
sudo mkdir -p
/root/.ssh
sudo echo
"<zabbix-server-public-key>" >>
/root/.ssh/authorized_keys
sudo chmod
600 /root/.ssh/authorized_keys
步骤 0:配置 Zabbix 服务器
登录 Zabbix Web UI。导航到 配置 > 主机 > 创建主机。
填写所需信息:主机名:目标系统的名称。
IP/DNS:Linux 主机的地址。
模板:附加相关模板(例如,“Template OS Linux by SSH”)
步骤 1:创建新模板:
导航到数据收集 → 模板
创建新模板
模板名称:Template Linux by SSH-Agentless模板组:Template operating system
步骤 2:创建项目
2.1 主项目:
导航到我们创建的模板并创建一个 新 项目。
名称: SSH Get
类型: SSH 代理
键: ssh.run[ssh.get,{$SSH.IP},{$SSH.PORT},,]
信息类型:文本认证方法:密码更新间隔: 根据您的监控需求
执行脚本:#!/bin/bash
mpstat && uptime && free
Zabbix: 项目- SSH get
步骤 3:创建依赖项目
配置 Zabbix 依赖项目的步骤
导航到收集 uptime 命令输出的主机/项目。创建 主项目(SSH get 作为输出)。
添加每个 依赖项目 并将其链接到主项目。
为每个依赖项目使用预处理规则。测试配置以确保正确提取值。
使用 SSH get 作为主项目,并使用预处理步骤提取以下依赖项目:
Zabbix: 项目
3.1 系统运行时间
键:ssh..uptime
主项目:ssh.get预处理:
正则表达式模式:up\s+(.+)?,结果:\1
Zabbix: 项目-系统.uptime
3.2 内核版本
键:ssh.kernel.version
主项目:ssh.get预处理:使用正则表达式过滤内核
3.3 架构类型 (aarch)
键:ssh.arch.type
主项目:ssh.get预处理:使用正则表达式过滤 aarch
3.4 操作系统类型
键:ssh.os.type
主项目:ssh.get预处理:使用正则表达式过滤操作系统
3.5 CPU 数量
键:ssh.cpu.count
主项目:ssh.get预处理:使用正则表达式过滤 CPU
3.6 CPU 空闲
键:ssh.cpu.idle
主项目:ssh.get预处理:
正则表达式模式:all\s+[0–9.]+\s+[0–9.]+\s+[0–9.]+\s+[0–9.]+\s+[0–9.]+\s+[0–9.]+\s+[0–9.]+\s+[0–9.]+\s+[0–9.]+\s+([0–9.]+) 结果:\1
Zabbix 项目:系统.cpu.idle
3.7 其他指标(遵循相同流程):
ssh.cpu.user (用户 CPU)ssh.cpu.system (系统 CPU)ssh.cpu.iowait (IO 等待)ssh.cpu.irq (IRQ)
3.8 内存:
总内存
键:ssh.memory.total
主项目:ssh.get信息类型:数字(无符号)预处理:
正则表达式: 模式:.*Mem:\s+(\d+).*结果:\1
自定义乘数:1024
其他指标(遵循相同流程):
ssh.memory.used (已用内存)ssh.memory.free (空闲内存)ssh.memory.shared (共享内存)ssh.memory.buffcache (缓冲区/缓存)ssh.memory.available (可用内存)
步骤 4:创建图表
4.1 CPU 利用率图表
创建一个名为 CPU 利用率 的新图表。添加项目:ssh.cpu.userssh.cpu.systemssh.cpu.idlessh.cpu.iowait
Zabbix: 图表-CPU
4.2 内存利用率图表
创建一个名为 内存利用率 的新图表。添加项目:ssh.memory.usedssh.memory.freessh.memory.available
Zabbix: 图表
步骤 5:创建触发器
5.1 系统名称更改
名称:系统名称已更改
表达式:{Template Linux By SSH-Agentless:ssh.
os.
type.diff()}=
1严重性:信息。
5.2 CPU 数量更改
名称:CPU 数量已更改
表达式:{
Template Linux By SSH-
Agentless:ssh.cpu.
count.diff()}=
1严重性:警告。
5.3 内核更改
名称:内核版本已更改
表达式:{Template Linux By SSH-Agentless:ssh.kernel.version.diff()}=1
严重性:警告。
5.4 CPU 使用率触发器
80% 持续 5 分钟
名称:高 CPU 使用率 (80%)
表达式:{
Template Linux By SSH-Agentless:ssh.cpu.user.avg(5m)}>
80严重性:高。
5.5 90% 持续 5 分钟
名称:严重 CPU 使用率 (90%)
表达式:{
Template Linux By SSH-Agentless:ssh.cpu.user.avg(5m)}>
90严重性:灾难。
内存使用率触发器
5.6 内存 80% 持续 5 分钟
名称:高内存使用率 (80%)
表达式:{
Template Linux By SSH-Agentless:ssh.memory.used.avg(5m)} >
0.8 * {
Template Linux By SSH-Agentless:ssh.memory.total.last()}
严重性:高。
5.7 内存 90% 持续 5 分钟
名称:严重内存使用率 (90%)
表达式:{
Template Linux By SSH-Agentless:ssh.memory.used.avg(5m)} >
0.9 * {
Template Linux By SSH-Agentless:ssh.memory.total.last()}
严重性:灾难。
5.8 系统重启
名称:系统已重启
表达式:{Template Linux By SSH-Agentless:ssh.system.uptime.last()}<300
严重性:警告。
5.9 SSH 无法连接
名称:SSH 连接失败
表达式:{Template Linux By SSH-Agentless:ssh.metrics.nodata(300)}=1
严重性:高。
5.10 最后 2 次无数据
名称:2 个间隔无数据
表达式:{Template Linux By SSH-Agentless:ssh.metrics.nodata(600)}=1
严重性:警告。
通过遵循这些步骤,您将拥有一个强大的 SSH 无代理监控模板,用于 Linux,包含详细的指标、图表和主动触发器。
关键词
Zabbix 无代理监控使用 SSH 监控 Linux基于 SSH 的系统指标CPU 和内存监控Zabbix SSH 监控指南
结论
Zabbix 无代理监控提供了一种强大而灵活的解决方案,用于在不安装额外软件的情况下跟踪 Linux 系统性能。通过利用 SSH,您可以有效地监控 CPU、内存、运行时间和其他关键指标。立即开始使用 Zabbix 无代理监控,简化您的基础设施管理。