2026年01月23日/ 浏览 7
部署完两周后,园区网在流量高峰也没出大问题,日常故障率降了,工程师巡检基本就靠几条常用的 show 命令把脉。有人把设备丢给新人,培训半小时后就能上手做日常维护。别笑,这事儿就是发生了。

事情得从现场调试说起。项目初期,公司选了锐捷作为主干和接入设备,理由很直接:命令不拐弯、功能够用、逻辑清楚。把它跟别家比,既不像 Cisco 那样指令层层嵌套,也不像某些国产货那样功能被阉割。用过几回的人都会发现一个特点——语法亲民但不牺牲能力,这点在后面排故障时体现得很明显。
说回那次故障。网络开始丢包,用户抱怨上网慢。我先是从顶层开始看:查看版本、资源、路由表这些信息,把整体态势摸清楚。常用的查看命令就是这些:show running-config、show startup-config、show version、show system resource、show license、show inventory、show clock、show log。用这些命令可以很快知道设备配置、启动项、系统负载、模块信息和日志情况。其实工程师的基本功就是这些命令,如果连 show running-config 都不会,很难说你是来干事的。
进入设备时,锐捷的命令行层次分得很清楚,像个层级图。第一层是最浅的普通视图,提示符通常是 >,能看一些简单信息;再往上输入 enable,会进入有更多查看权限的提示符,通常是 #;要改配置就进到全局配置模式,提示符带上 (config)#;对接口做细节配置时,会看到 (config-if)#;遇到诊断需要,进入某些特定视图或 debug 模式。这套分层不复杂,但约定明确,做事的时候心里有谱。
调试时我会按从全局到局部的顺序来:先看设备健康(show system resource、show version),再看接口和 VLAN 情况(show interfaces brief、show vlan、show interface trunk),然后看路由(show ip route)、VRRP(show vrrp)和 DHCP 状态(show dhcp binding、show dhcp server statistics),最后查 ACL、STP 状态(show spanning-tree、show mstp)以及链路冗余协议 RRPP(show rrpp)。这次问题最后定位到某几台接入交换机的端口在高并发下出现丢包,跟 VLAN 绑定、Trunk 配置和 ACL 规则都有关系。顺着线索,先把相关端口的统计和错误帧抓出来,再看两端的 Trunk 配置是否一致。锐捷的 Trunk 命令跟 Cisco 很接近,上手迁移很顺畅,所以这步排查很快。
在配置和操作细节上,常用命令也很直白:进入特权模式用 enable;要修改配置就用 configure terminal;做完一步退回上级用 exit;回到顶层视图可以用 quit 或 end;保存配置用 write,或者把 running-config 拷贝到 startup-config(copy running-config startup-config)。还有一点不错:锐捷支持不少别名,常用命令可以简写,日常运维更省力。
项目中 80% 的基础工作都围绕接口、VLAN、Trunk 展开。查看端口状态、VLAN 列表、端口归属这些最常见。大多数锐捷三层交换机出厂时默认打开路由功能,遇到被管理员关闭的情况,只要人工启用路由功能,三层转发就能恢复。查看路由信息一般用 show ip route,查 BGP 或 OSPF 的状态分别是 show bgp、show ospf,必要时可以看邻居状态和路由表细节。VRRP 在网关冗余场景很常见,查询状态用 show vrrp;DHCP 服务在网关端常常承载租约分配,启用方式有设备作服务器或中继,两边都要确认,查看租约和统计能帮你判断是不是 DHCP 导致的访问问题。
交换机的生成树也不能忽视,使用 show spanning-tree 或 show mstp 检查端口角色、阻塞状态和优先级设置,MSTP 配置在园区网里能避免环路同时保持灵活性。锐捷在园区网里还常用 RRPP 做链路快速切换,查看 rrpp 状态用 show rrpp,问题出现时看切换日志和事件历史很有帮助。ACL 在排查访问控制相关问题时必查,规则一错,某些业务直接白屏。
如果是网关或核心设备,需要关注的还有系统资源和硬件信息:show system resource 会告诉你 CPU 和内存占用,show license、show inventory 则能确认授权和模块序列号,必要时把时间同步(show clock)和日志(show log)一并核对,时间线对排错很重要。我见过好几起,大家把日志当成文本挖掘工具,一条时间错乱就把原因追到半个月前。
无线那块也要提一句。企业无线的故障往往和接入策略、AP 管理、CAPWAP 或控制器配置相关。常见操作是查看控制器状态、AP 列表、客户端连接详情,命令因平台略有不同,但思路一致:先确认控制器和 AP 间的连接,再看无线策略和 IP 分配是否正常。掌握这些,就能覆盖大部分园区网问题。
整个过程中最节省时间的,是把日常最常用的那些命令记住,固定成习惯。锐捷的命令集合稳定、直观,入门和平时干活都会省力。说白了,这东西好用就好用,别把它当成战术口号来吹,真遇事儿就见效。