PLC通信时通时断?这6个排查步骤请收好!

2026年01月22日/ 浏览 6

干PLC这行的,最怕啥?设备跑得好好的,突然通信断了!过一会儿自己又好了,反反复复,搞得人神经衰弱。报警记录查不出个所以然,领导催、生产急,头都大了!这种“时通时断”的毛病,最是磨人。别慌,老规矩,按我这套“笨”办法,一步一步来!

第1步:先看“面子”,物理连接是基础!

动手查线路:

网线/通讯线: 用手顺着线捋一遍,重点检查拐弯处、接头附近、容易被踩压或靠近热源的地方。线皮有没有破损、压扁?水晶头/DB头/端子压接牢不牢?别光看,用手轻轻晃晃接头,看通信状态指示灯会不会跟着闪! 有时候就是接触不良。

光纤: 检查光纤跳线有没有过度弯折(最小弯曲半径要遵守!),接口是否清洁?有灰尘也会导致信号衰减不稳定。

“眼见为实”看灯号: 这是最直观的!找到PLC、交换机、HMI、远程IO模块等设备上的LINK/ACT (连接/活动) 指示灯。

正常:LINK灯常亮(表示物理链路通),ACT灯闪烁(表示有数据活动)。

异常: LINK灯时亮时灭?ACT灯长时间不闪或乱闪?记下是哪个设备的灯在抽风! 这直接指向问题设备或端口。

“简单粗暴”换端口/换线缆:

如果怀疑是交换机端口问题,把网线换个口试试。

备一根确认好的通讯线(网线、Profibus线等),直接替换掉怀疑的线路。 这是判断线缆问题最快的方法!别舍不得备件。

第2步:查“里子”,电源与接地是关键!

电源稳不稳? 通信模块、交换机、甚至一些传感器/执行器的供电电源是否稳定?用万用表量一下电压,尤其要在通信中断的时候测! 看电压有没有明显跌落或波动?24V掉到20V以下,通信就可能抽风。检查电源端子是否拧紧?电源模块容量是否足够(特别是带了很多模块时)?接地靠不靠谱?这是“时通时断”的超级元凶!检查PLC机架、交换机柜、设备外壳的接地线是否牢固、可靠地连接到标准的接地排上?线够不够粗?重点: 通讯线缆的屏蔽层是否单端良好接地?绝对避免两端都接地形成“地环路”,这会引起干扰导致通信不稳定。检查屏蔽层压接的端子或DP头的屏蔽夹是否有效连接。现场有大电机、变频器启动时通信就断?十有八九是接地不良或动力电缆干扰。

第3步:查“相邻”,网络设备别忽视!

交换机/集线器: 这是网络通信的“十字路口”。

状态灯: 看对应端口的LINK/ACT灯是否正常?是整个交换机抽风,还是某个端口?

散热: 摸一下烫不烫?过热会导致交换机性能不稳定甚至死机重启。

配置: (如果懂网络基础)检查是否有端口速率/双工模式不匹配?比如一端强制100M全双工,另一端自适应,就可能协商不好导致时通时断。尽量两边都设成自适应(Auto Negotiation)或强制成一致。

环路? 网络拓扑是否简单清晰?有没有不小心接成环路了?这会引起广播风暴拖垮网络。简单的网络可以用STP(生成树协议),复杂的要规划好。

中继器/光纤转换器: 检查这些设备本身工作是否正常?电源是否稳定?状态指示灯?

第4步:查“软件配置”,参数设置要抠细!

IP地址/D设备号: 这是通信的“门牌号”。

检查所有参与通信的设备(PLC、HMI、驱动器、IO设备等)IP地址是否在同一网段且唯一? 有没有冲突?子网掩码对不对? 网关设没设错?

对于Profibus-DP等,DP地址是否唯一? 主站配置的从站地址和实际硬件拨码或软件设置的是否一致?

通信参数: 波特率、数据位、停止位、校验方式必须完全匹配!两边设备设置要一模一样,差一点都不行。

主从关系/轮询周期: 主站配置是否正确识别了所有从站?轮询周期是否设置合理?周期太短,网络负担重;周期太长,响应慢。对于数据量大的从站,可以单独设置更长的轮询时间。

项目一致性: 在线查看PLC的硬件组态,和实际安装的模块型号、固件版本是否完全一致?特别是GSD文件安装是否正确?有时候升级了固件没更新GSD文件,通信就闹情绪!

第5步:查“自身”,PLC与模块状态要看清!

诊断缓冲区/报警记录: 这是PLC的“黑匣子”!发生通信中断时,第一时间去这里翻记录!仔细查看中断时刻PLC(特别是CPU和通信模块)记录的诊断信息。里面往往藏着“金矿”,比如“找不到从站XX”、“通信超时”、“IO访问错误”、“模块故障”等具体指向性的信息。西门子S7系列在STEP7/TIA Portal里看“诊断缓冲区”;罗克韦尔在Studio 5000里看“控制器事件”;三菱在GX Works里看“诊断”或“模块错误信息”。模块状态灯: CPU、通信处理器(CP卡)、通信模块(如ET200SP的IM接口模块)上的ERROR/STATUS灯。是常亮?闪烁?什么颜色?不同状态代表不同故障等级。模块温度/负载: 在软件里查看CPU和通信模块的工作温度、循环周期负载、通信负载是否过高?长时间高负载运行可能导致不稳定。

关键点:诊断信息的时间戳非常重要! 对照着发生通信中断的时间点去找对应的记录,能极大缩小范围。

第6步:上“仪器”,数据抓包见真章!

如果前面五步都做了,问题还是神出鬼没,那就得上点“硬家伙”了——网络抓包分析。

需要工具:

一台带网口的笔记本电脑。

一个工业交换机(带端口镜像功能) 或者 网络分流器(TAP)。普通家用交换机不行!

网络抓包软件:Wireshark (免费且强大) 是首选。

怎么做:

在工业交换机上,将连接PLC或关键设备的端口镜像(Mirror) 到你接笔记本电脑的端口。

在笔记本上打开Wireshark,选择正确的网卡,开始抓包。

让网络运行,等待通信中断现象发生。一定要在发生问题时抓到数据!

停止抓包,保存数据文件。

看什么:

ARP风暴/Broadcast风暴: 看是不是有设备在疯狂发广播包占用带宽?

TCP重传: 大量TCP重传说明网络丢包严重,通信双方在反复重试。

协议错误: 比如Profibus/Profinet/Modbus TCP的报文格式错误、校验错误。

通信超时: 主站发出的请求没有在规定时间内收到从站响应。

异常设备: 有没有未知的MAC地址或IP地址在发奇怪的数据?可能是病毒或非法设备接入。

picture loss