《交换机二层环路问题处理指南建筑修缮加固与改造_建筑-修缮加固与改造.pdf》由会员分享,可在线阅读,更多相关《交换机二层环路问题处理指南建筑修缮加固与改造_建筑-修缮加固与改造.pdf(19页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、目录 1 介绍.3 2 网络业务故障,如何确认存在环路?.3 2.1 第一步:是否可以通过端口流量发现数据风暴?.4 2.2 第二步:是否可以通过 MAC-Flapping检测漂移?.5 2.2.1 框式交换机.5 2.2.2 盒式交换机.7 2.3 第三步,是否可以通过环路检测发现环路?.8 2.3.1 Loop Detection(框式).9 2.3.2 Loopback Detection(盒式).10 3 环路问题发生后,如何快速破环?.11 3.1 第一步:是否理解网络业务并明确拓扑?.11 3.2 第二步:是否需要用影响最小的方法破环?.11 3.2.1 方法一:端口退出成环 VL
2、AN破环 .11 3.2.2 方法二:shutdow n成环端口破环 .11 3.2.3 方法三:通过拔出成环光纤破环 .11 3.3 第三步:操作后确认业务是否恢复?.12 4 环路问题发生后,如何定位问题根因?.12 4.1 第一步:是否由于近期施工操作引入环路?.12 4.2 第二步:是否由于近期修改配置引入的环路?.12 4.3 第三步:是否典型的常见环路问题?.13 4.3.1 交换机自环出现环路 .13 4.3.2 交换机下游设备自环出现环路.13 4.3.3 环形组网链路震荡导致环收敛震荡 .14 4.3.4 环形组网寄存器下发失败无法破环 .14 4.3.5 链路单通引入RRP
3、P网络单向环.15 436 协议堵塞的端口 L2PT(bpdu-tunnel)协议报文成环 .16 437 下游设备报文转发异常导致疑似环路 .17 4.4 第四步:收集信息返回研发分析 .17 5 环路问题解决后,网络是否需要优化?.19 5.1 第一步:是否需要部署适当的破环协议?.19 5.2 第二步:是否需要提升链路质量和可靠性?.19 5.3 第三步:是否需要部署广播抑制提升网络健壮性?.19 5.4 第四步:是否需要部署 QoS保证协议报文优先转发?.19 6 结束语.19移框式交换机盒式交换机第三步是否可以通过环路检测发现环路框式盒式环路问题发生后如何快速破环第一步是否理解网络业
4、务并明确拓扑第二步是否需要用影响最小的方法破环方法一端口退出成环破环方法二成环端口破环方法三工操作引入环路第二步是否由于近期修改配置引入的环路第三步是否典型的常见环路问题交换机自环出现环路交换机下游设备自环出现环路环形组网链路震荡导致环收敛震荡环形组网寄存器下发失败无法破环链路单通引入网络单向后网络是否需要优化第一步是否需要部署适当的破环协议第二步是否需要提升链路质量和可靠性第三步是否需要部署广播抑制提升网络健壮性第四步是否需要部署保证协议报文优先转发结束语介绍以太网链路由于各种原因导致数据1 介绍 以太网链路由于各种原因,导致数据或协议报文环形转发,导致网络形成数据风暴,最 终影响正常业务。
5、本文档仅介绍二层网络的常见环路问题识别和处理。本指导手册按照如下思路进行二层环路问题分析和处理:1、网络业务故障,如何观察确认存在二层环路?2、环路问题发生后,如何快速破环恢复业务?3、如何排查环路问题的根本原因,是否已知案例?。4、针对问题原因,对网络进行适当的优化。处理二层环路问题,您首先需要准备如下:1、整网的拓扑图,包含设备名称、登陆方式、系统 MAC。2、登陆软件,记录全部的操作记录。准备好这些,我们开始二层环路问题的处理之旅。2 网络业务故障,如何确认存在环路?网络业务故障后,如发生二层环路,通常会存端口流量数据风暴和反复大量的 MAC漂 移现象。因此,在骨干链路所在的节点,通过如
6、下三步操作:-是一 可能存在 坯路/图1:环路排查流程图 可以判断网络是否可能存在二层环路。移框式交换机盒式交换机第三步是否可以通过环路检测发现环路框式盒式环路问题发生后如何快速破环第一步是否理解网络业务并明确拓扑第二步是否需要用影响最小的方法破环方法一端口退出成环破环方法二成环端口破环方法三工操作引入环路第二步是否由于近期修改配置引入的环路第三步是否典型的常见环路问题交换机自环出现环路交换机下游设备自环出现环路环形组网链路震荡导致环收敛震荡环形组网寄存器下发失败无法破环链路单通引入网络单向后网络是否需要优化第一步是否需要部署适当的破环协议第二步是否需要提升链路质量和可靠性第三步是否需要部署广
7、播抑制提升网络健壮性第四步是否需要部署保证协议报文优先转发结束语介绍以太网链路由于各种原因导致数据2.1 第一步:是否可以通过端口流量发现数据风暴?通过display in terface brief命令,查看所有接口下的流量,存在环路的接口上 InUti和 OutUti两个计数会逐步增加:第一次查询:151disp in terface Ether net brief|in up PHY:Physical*dow n:adm ini stratively dow n(I):loopback(b):BFD dow n In Uti/OutUti:in put utility/output ut
8、ility In terface PHY Auto-Neg Duplex Ban dwidth InUti OutUti Trunk GigabitEthernetO/O/2 up en able full 100M 0%0.01%-GigabitEthernetO/O/16 up en able full 1000M 0.56%0.56%1 GigabitEthernet1/0/12 up en able full 1000M 0.56%0.56%1 MEthO/O/1 up en able half 100M 0.01%0.01%-最后一次查询:151disp in terface Eth
9、er net brief|in up PHY:Physical*dow n:adm ini stratively dow n(l):loopback(b):BFD dow n In Uti/OutUti:in put utility/output utility In terface PHY Auto-Neg Duplex Ban dwidth In Uti OutUti Trunk GigabitEthernet0/0/2 up en able full 100M 0%0.01%-GigabitEthernet0/0/16 up en able full 1000M 76%76%1 Giga
10、bitEthernet1/0/12 up en able full 1000M 76%76%1 MEth0/0/1 up en able half 100M 0.01%0.01%-一般情况下,查询只能看到网络的当前流量结果,此时需要和网络的正常业务流量进行比较,业务流量的带宽可以从客户的网络流量监控图获取。如果只有一台设备的一个端口出入方向流量较大,可能是单端口环回。如果只有一台设备的两个端口流量较大,可能是本设备两个端口环回;如果某端口只有单方向流量,只有出或者只有入,需要重点排查,因为环路有可能在该端口 的上下游设备。通常情况下:如果当前网络流量远大于正常业务,可能存在二层环路。如果当前网
11、络流量正常,没有部署广播抑制,没有二层环路。如果当前网路流量比正常流量稍大,且部署了广播抑制,需要继续后面的第二步和第三步操 作。移框式交换机盒式交换机第三步是否可以通过环路检测发现环路框式盒式环路问题发生后如何快速破环第一步是否理解网络业务并明确拓扑第二步是否需要用影响最小的方法破环方法一端口退出成环破环方法二成环端口破环方法三工操作引入环路第二步是否由于近期修改配置引入的环路第三步是否典型的常见环路问题交换机自环出现环路交换机下游设备自环出现环路环形组网链路震荡导致环收敛震荡环形组网寄存器下发失败无法破环链路单通引入网络单向后网络是否需要优化第一步是否需要部署适当的破环协议第二步是否需要提
12、升链路质量和可靠性第三步是否需要部署广播抑制提升网络健壮性第四步是否需要部署保证协议报文优先转发结束语介绍以太网链路由于各种原因导致数据LSW2 LSW1 LSW3 2.2 第二步:是否可以通过 MAC-Flapping 检测漂移?MAC地址漂移即设备上一个接口学习到的 MAC地址在同一 VLAN中另一个接口上也学 习到,后学习到的 MAC地址表项的覆盖原来的表项。导致MAC地址漂移的因为包括网络存在环路、或者非法用户进行网络攻击。例如下图,当Switchl向两个方向同时发报文时,在 Switch2上的两个不同端口都会收 到该报文,从而出现 MAC地址漂移。当Switch2的两个端口出现了 M
13、AC地址漂移时,说明 交换机的两个端口间可能出现了环路。图 2:MAC-Flapping 示意图 MAC地址漂移,交换机所有形态和版本均默认支持漂移,具体的 MAC漂移配置主要是 指漂移后是否告警,漂移后是否设置端口堵塞的功能。由于框式交换机和盒式交换机 MAC漂移检测的命令行和检测存在差异,我们分别介绍:2.2.1 框式交换机 V1R2版本,在非S系列单板上支持全局使能的 MAC-Flapping检测功能(全局使能,只 支持发送TRAF)。在V1R2上,开启MAC地址漂移检测:Quidwaymac-flapp ing alarm en able V1R3及以后的版本,在V1R2版本的基础上,
14、新增了基于VLAN的MAC地址漂移检测、检测到MAC地址漂移后执行对应的动作策略。在V1R3及以后的版本上,开启 MAC地址漂移检测(下面两个命令均可使用):系统视图下:Quidwayloop-detect eth-loop alarm-only VLAN 视图下:Quidway-vla n1001loop-detect eth-loop alarm-o nly 移框式交换机盒式交换机第三步是否可以通过环路检测发现环路框式盒式环路问题发生后如何快速破环第一步是否理解网络业务并明确拓扑第二步是否需要用影响最小的方法破环方法一端口退出成环破环方法二成环端口破环方法三工操作引入环路第二步是否由于近期
15、修改配置引入的环路第三步是否典型的常见环路问题交换机自环出现环路交换机下游设备自环出现环路环形组网链路震荡导致环收敛震荡环形组网寄存器下发失败无法破环链路单通引入网络单向后网络是否需要优化第一步是否需要部署适当的破环协议第二步是否需要提升链路质量和可靠性第三步是否需要部署广播抑制提升网络健壮性第四步是否需要部署保证协议报文优先转发结束语介绍以太网链路由于各种原因导致数据各个版本的告警信息存在一定的差异,样例如下:版本 告警信息 V1R1 不支持 V1R2 全局检测 L2IF/4/MAC_FLAPPING_ALARM:OID 1.3.6.1.4.1.2011.5.25.42.2.1.7.12Th
16、e mac-address has flap value.(BaseTrapSeverity=O,BaseTrapProbableCause=0,BaseTrapEve ntType=4,L2IfPort=549,e ntPhysicall ndex=1,MacAdd=0000-0000-002b,vla ni d=1001,FormerlfDescName=Ethernet3/0/2,Curre ntlfDescName=Ethe rnet3/0/3,DeviceName=S9306-169)VLAN检测 不支持 V1R3 全局检测 L2IFPPI/4/MAC_FLAPPING_ALARM:
17、OID 1.3.6.1.4.1.2011.5.25.42.2.1.7.12The mac-address has flap value.(L2IfPort=0,e ntPhysicall ndex=O,BaseTrapSeverity=4,BaseTrapProbableCause=549,BaseTrapEve ntType=1,MacAdd=00e0-fc00-4447,vla nid=1001,FormerlfDescName=GigabitEthernet6/0/6,Curre ntlfDescNa me=GigabitEthernet6/0/7,DeviceName=9306-222
18、.159)VLAN检测 L2IFPPI/4/MFLPVLANALARM:OID 1.3.6.1.4.1.2011.5.25.160.3.7 Loop exist in vlan 1001,for mac-flapp ing.V1R6 全局检测 L2IFPPI/4/MAC_FLAPPING_ALARM:OID 1.3.6.1.4.1.2011.5.25.42.2.1.7.12The mac-address has flap value.(L2IfPort=0,e ntPhysicall ndex=0,BaseTrapSeverity=4,BaseTrapProbableCause=549,Bas
19、eTrapEve ntType=1,MacAdd=0025-9e6e-1c55,vla nid=1001,FormerIfDescName=GigabitEthernet2/1/23,Curre ntlfDescNa me=GigabitEthernet2/1/22,DeviceName=9303-222.157)VLAN检测 L2IFPPI/4/MFLPVLANALARM:OID 1.3.6.1.4.1.2011.5.25.160.3.7 Loop exists in vlan 1001,for flapp ing mac-address 0025-9e6e-1c55 betwee n po
20、rt GE2/1/23 and port GE2/1/22.移框式交换机盒式交换机第三步是否可以通过环路检测发现环路框式盒式环路问题发生后如何快速破环第一步是否理解网络业务并明确拓扑第二步是否需要用影响最小的方法破环方法一端口退出成环破环方法二成环端口破环方法三工操作引入环路第二步是否由于近期修改配置引入的环路第三步是否典型的常见环路问题交换机自环出现环路交换机下游设备自环出现环路环形组网链路震荡导致环收敛震荡环形组网寄存器下发失败无法破环链路单通引入网络单向后网络是否需要优化第一步是否需要部署适当的破环协议第二步是否需要提升链路质量和可靠性第三步是否需要部署广播抑制提升网络健壮性第四步是否需
21、要部署保证协议报文优先转发结束语介绍以太网链路由于各种原因导致数据222 盒式交换机 盒式交换机(不包括 23、27系列)V1R3及以后版本,不支持全局使能的 MAC地址漂 移检测,只支持基于 VLAN的MAC地址漂移检测,同时支持检测到漂移后的发送 TRAP阻 塞端口等动作。开启MAC地址漂移检测:VLAN视图下:Quidway-via n1001loop-detect eth-loop alarm-only 各个版本的告警信息存在一定的差异,样例如下:版本 告警信息 V1R3 L2IF/4/MFLPPORTRESUME:OID1.3.6.1.4.1.2011.5.25.160.3.7 Lo
22、op exist in via n for(hwMflpVla nld:1001;hwMflpVla nCfgAlarmReaso n:for flapp ing mac-address 0000-0000-002b betwee n port GE0/0/24 and port GE0/0/23)V1R3 L2IFPPI/4/MFLPVLANALARM:OID1.3.6.1.4.1.2011.5.25.160.3.7 Loop exists in vlan 1001,for flapping mac-address 0000-0000-002b between port GE0/0/24 a
23、nd port GE0/0/23.V1R6 L2IFPPI/4/MFLPVLANALARM:OID1.3.6.1.4.1.2011.5.25.160.3.7 Loop exists in vlan 1001,for flapping mac-address 0000-0000-002b between port GE0/0/24 and port GE0/0/23.移框式交换机盒式交换机第三步是否可以通过环路检测发现环路框式盒式环路问题发生后如何快速破环第一步是否理解网络业务并明确拓扑第二步是否需要用影响最小的方法破环方法一端口退出成环破环方法二成环端口破环方法三工操作引入环路第二步是否由于近
24、期修改配置引入的环路第三步是否典型的常见环路问题交换机自环出现环路交换机下游设备自环出现环路环形组网链路震荡导致环收敛震荡环形组网寄存器下发失败无法破环链路单通引入网络单向后网络是否需要优化第一步是否需要部署适当的破环协议第二步是否需要提升链路质量和可靠性第三步是否需要部署广播抑制提升网络健壮性第四步是否需要部署保证协议报文优先转发结束语介绍以太网链路由于各种原因导致数据2.3 第三步:设备作为三层网关,是否存在大量 ARP 报文被 CPCAR 丢包记录?disp clock 2011-11-30 20:04:32 Wedn esday Time Zone:BJ add 08:00:00 di
25、sp cpu-defe nd arp-request statistics slot 3 CPCAR on slot 3 Packet Type Pass(Bytes)Drop(Bytes)Pass(Packe ts)Drop(Packe ts)arp-request 91720644 61001339156 1348833 897078517 disp cpu-defe nd arp-reply statistics slot 3 CPCAR on slot 3 Packet Type Pass(Bytes)Drop(Bytes)Pass(Packe ts)Drop(Packe ts)arp
26、-reply 381073700 46925484540 5604025 690080655 disp clock 2011-11-30 20:04:35 Wedn esday Time Zone:BJ add 08:00:00 disp cpu-defe nd arp-request statistics slot 3 CPCAR on slot 3 Packet Type Pass(Bytes)Drop(Bytes)Pass(Packe ts)Drop(Packe ts)arp-request 91728872 61001759940 1348954 897084705 disp cpu-
27、defe nd arp-reply statistics slot 3 CPCAR on slot 3 Packet Type Pass(Bytes)Drop(Bytes)Pass(Packe ts)Drop(Packe ts)arp-reply 381082540 46925484540 5604155 690080655 通 常 情 况 下,A R P的 交 互 是 有 序 进 行,短 时 间 内 不 会 出 现 超 多 报 文 的 丢 弃。问题一般发生在9300作为汇聚网关场景,出现上述情况后,可能的原因是 ARP的广播 报文在物理环形的网络中转发,形成协议报文的风暴,当前设备上送 C
28、P U,被 交 换 机 C P U 限速丢弃。移框式交换机盒式交换机第三步是否可以通过环路检测发现环路框式盒式环路问题发生后如何快速破环第一步是否理解网络业务并明确拓扑第二步是否需要用影响最小的方法破环方法一端口退出成环破环方法二成环端口破环方法三工操作引入环路第二步是否由于近期修改配置引入的环路第三步是否典型的常见环路问题交换机自环出现环路交换机下游设备自环出现环路环形组网链路震荡导致环收敛震荡环形组网寄存器下发失败无法破环链路单通引入网络单向后网络是否需要优化第一步是否需要部署适当的破环协议第二步是否需要提升链路质量和可靠性第三步是否需要部署广播抑制提升网络健壮性第四步是否需要部署保证协议
29、报文优先转发结束语介绍以太网链路由于各种原因导致数据2.4 第四步,当前是否可以增加配置环路检测发现环路?框式交换机和盒式交换机都支持检测环,框式交换机的环路监测称为 Loop Detection;盒式交换机的环回监测称为 Loopback Detection。2.4.1 Loop Detection(框式)框式交换机端口配置 Loop Detection功能以后,设备会从该端口发送环路检测报文,在 端口所属且使能 Loop Detection功能的VLAN内进行环路检测,如果设备接收到自己发送的 检测报文,网络上存在环路。框式交换机上的环路监测能检测到下面两种情况下的端口环路:1、设备上端口
30、收到本端口发送的检测报文。2、设备上端口收到非本端口发送的检测报文。开启了 Loop Detection以后,用display loop-detection命令可以查看当前环路检测的状 态,用display loop-detection in terface 命令可以查看具体某一个端口的状态。display loop-detect ion Loop Detecti on is en able.Detect ion in terval time is 5 sec on ds.Follow ing vla ns en able loop-detect ion:vlan 556 Follow ing
31、 ports are blocked for loop:NULL Follow ing ports are shutdow n for loop:NULL Follow ing ports are no lear ning for loop:NULL display loop-detect ion in terface gigabitether net 1/0/0 The port is en able.The ports status lis t:Status WorkMode Recovery-time En abledVLAN Normal Shutdow n 200 556 移框式交换
32、机盒式交换机第三步是否可以通过环路检测发现环路框式盒式环路问题发生后如何快速破环第一步是否理解网络业务并明确拓扑第二步是否需要用影响最小的方法破环方法一端口退出成环破环方法二成环端口破环方法三工操作引入环路第二步是否由于近期修改配置引入的环路第三步是否典型的常见环路问题交换机自环出现环路交换机下游设备自环出现环路环形组网链路震荡导致环收敛震荡环形组网寄存器下发失败无法破环链路单通引入网络单向后网络是否需要优化第一步是否需要部署适当的破环协议第二步是否需要提升链路质量和可靠性第三步是否需要部署广播抑制提升网络健壮性第四步是否需要部署保证协议报文优先转发结束语介绍以太网链路由于各种原因导致数据告警
33、示例如下:版本 告警信息 V1R2 LDT/4/DetectLoop:OID:1.36 1 41.2011.5.25.174.3.1 In terfaceI ndex:12 InterfaceName:Ethernet3/0/1 VlanListLow:VlanListHigh:,The port detected loop!V1R3 LDT/4/DetectLoop:OID:1.3.6.1.4.1.2011.5.25.174.3.1 In terfaceI ndex:7 InterfaceName:GigabitEthernet6/0/1 VlanListLow:1000 VlanListH
34、igh:none.The port detected loop!V1R6 LDT/4/DetectLoop:OID:1.3.6.1.4.1.2011.5.25.174.3.1 The port detected loop.(In terfaceI ndex:14 In terfaceName:GigabitEthernet1/0/1 Vla nListLow:1000 Vian ListHigh:none)242 Loopback Detection(盒式)盒式交换机端口配置 Loopback Detection功能以后,设备会从该端口发送环路检测报文,一个untagged报文和指定 VLAN
35、 Tag报文。盒式交换机的 Loopback Detection,只能针对设备 上端口收到本端口发送的检测报文的环路。开启了 Loop Detection以后,用display loop-detection命令可以查看环路检测功能的配 置信息和接口状态信息。display loopback-detect Loopback-detect is en abled in the system view Loopback-detect in terval:30 Loopback-deteck sendin g-packet in terval:5 In terface ProtocolID Recov
36、erTime Actio n Status GigabitEthernetO/O/2 602 30 block NORMAL 盒式交换机告警示例如下:版本 告警信息 V1R3 LDT/4/Porttrap:OID 1.3.6.1.4.1.2011.5.25.174.3.3Loopback does exist on in terface(27)GigabitEthernet0/0/22(VLAN 1000),loopback detect status:2.(1:no rmal;2:block;3:shutdow n;4:trap;5:no lear n)V1R6 LDT/4/Porttrap
37、:OID 1.3.6.1.4.1.2011.5.25.174.3.3Loopback does exist on in terface(27)GigabitEthernet0/0/22(VLAN 1000),loopback detect status:2.(1:no rmal;2:block;3:shutdow n;4:trap;5:no lear n)移框式交换机盒式交换机第三步是否可以通过环路检测发现环路框式盒式环路问题发生后如何快速破环第一步是否理解网络业务并明确拓扑第二步是否需要用影响最小的方法破环方法一端口退出成环破环方法二成环端口破环方法三工操作引入环路第二步是否由于近期修改配置
38、引入的环路第三步是否典型的常见环路问题交换机自环出现环路交换机下游设备自环出现环路环形组网链路震荡导致环收敛震荡环形组网寄存器下发失败无法破环链路单通引入网络单向后网络是否需要优化第一步是否需要部署适当的破环协议第二步是否需要提升链路质量和可靠性第三步是否需要部署广播抑制提升网络健壮性第四步是否需要部署保证协议报文优先转发结束语介绍以太网链路由于各种原因导致数据3 环路问题发生后,如何快速破环?以太网的环路,会在短时间内形成数据风暴,当端口的流量达到带宽的最大负荷,会形 成链路拥塞,影响网络业务。因此,在确认网络发生数据环路后,请按照如下步骤处理:3.1 第一步:是否理解网络业务并明确拓扑?环
39、形网络拓扑一般较为复杂,可以向客户寻求网络拓扑结构全图,具体到网络的 VLAN 规划信息,每台设备名称、系统 MAC、管理IP,本端端口名称、对端端口名称。完整的拓扑信息是解决环路问题的首要条件,如果没有拓扑图,需要从发现环路的设备,通过逐跳登陆,记录设备信息、端口信息和 VLAN信息,手动绘制完整的拓扑。3.2 第二步:是否需要用影响最小的方法破环?紧急破环又称手动破环,当网络风暴严重影响正常的业务时,需要在尽快恢复业务。可以通过如下三个方法紧急破环:(注意紧急破环不要影响远程 telnet路径所在的设备、端口和 VLAN,避免无法登陆。)321 方法一:端口退出成环 VLAN 破环 将成环
40、的网络上,其中一个端口退出成环 VLAN,属于影响面最小的方法。端口 命令行 备注 Access undo default vlan 可能影响下游业务。Trunk undo port trunk allow-pass vlan id 无 Hybrid undo hybrid vlan id 不区分 tagged 禾口 untagged 备注:需要注意不要 shutdow n远程tel net路径所在的端口,避免无法远程登陆。3.2.2 方法二:shutdown成环端口破环 Shutdown成环的物理端口,也可以达到破环的效果。此时,需要保证 shutdown的端口两端在全部 VLAN内能够通信
41、。3.2.3 方法三:通过拔出成环光纤破环 通过拔出成环的光纤,可以紧急破环。移框式交换机盒式交换机第三步是否可以通过环路检测发现环路框式盒式环路问题发生后如何快速破环第一步是否理解网络业务并明确拓扑第二步是否需要用影响最小的方法破环方法一端口退出成环破环方法二成环端口破环方法三工操作引入环路第二步是否由于近期修改配置引入的环路第三步是否典型的常见环路问题交换机自环出现环路交换机下游设备自环出现环路环形组网链路震荡导致环收敛震荡环形组网寄存器下发失败无法破环链路单通引入网络单向后网络是否需要优化第一步是否需要部署适当的破环协议第二步是否需要提升链路质量和可靠性第三步是否需要部署广播抑制提升网络
42、健壮性第四步是否需要部署保证协议报文优先转发结束语介绍以太网链路由于各种原因导致数据备注:该方法可以使用 shutdown端口代替,只有在设备无法登陆时才使用。3.3 第三步:操作后确认业务是否恢复?通过ping等测证网络通信质量,并和客户一起观察现网业务是否已经恢复。环路拓扑存在冗余链路和配置,环路破除后业务会自行恢复,特殊情况在此不一概而论。4 环路问题发生后,如何定位问题根因?4.1 第一步:是否由于近期施工操作引入环路?如果环路问题是由于近期施工操作引入,可以和施工方确认,了解施工的过程,特别是 新增线路连接的细节,结合拓扑结构,确认后排出物理环路。4.2 第二步:是否由于近期修改配置
43、引入的环路?常见的容易配置引入环路的命令行如下:特性 命令行 成环原因 应对方案 接口管理 Undo shutdow n 端口进入转发引入环路。关闭端口或者部署 破环协议 STP Bpdu en able 盒式交换机端口下需要使能 bpdu enable命令才能接收并处 理STP报文。配置命令(V1R6及 以后版本已默认使 能)框式交换机端口下需要去使能 该命令,交换机才不会透传STP 报文。删除命令 bpdu bridge en able 使能该命令会导致 STP报文透 传,无法上送处理。删除命令 bpdu-t unnel stp bridge role provider 使能该命令会导致
44、STP无法处 理报文。删除命令 RRPP Rrpp en able 全局不配置 rrpp enable,无法 计算堵塞端口破环。配置命令 SmartLi nk Smartli nk en able SmartLink组模式下不使能该命 令,无法计算堵塞端口。配置命令 移框式交换机盒式交换机第三步是否可以通过环路检测发现环路框式盒式环路问题发生后如何快速破环第一步是否理解网络业务并明确拓扑第二步是否需要用影响最小的方法破环方法一端口退出成环破环方法二成环端口破环方法三工操作引入环路第二步是否由于近期修改配置引入的环路第三步是否典型的常见环路问题交换机自环出现环路交换机下游设备自环出现环路环形组网
45、链路震荡导致环收敛震荡环形组网寄存器下发失败无法破环链路单通引入网络单向后网络是否需要优化第一步是否需要部署适当的破环协议第二步是否需要提升链路质量和可靠性第三步是否需要部署广播抑制提升网络健壮性第四步是否需要部署保证协议报文优先转发结束语介绍以太网链路由于各种原因导致数据图3:设备自环出现环路 前置条件:交换机未配置 STP和LDT 问题现象 端口出方向和入方向流量持续增加。问题原因 端口自环或者链路环回。处理方法 1、首先在端口下去使能 loopback internal。2、设备由于链路引入环路有两种:一种是单端口收发环回。第二种是设备上两个端口环路。此类环路造成的原因是光纤或者网线误接
46、,需要拆除连线。4.3.2 交换机下游设备自环出现环路 4.3 第三步:是否典型的常见环路问题?431 交换机自环出现环路 图4:下游设备自环出现环路 前置条件:设备未部署 STP和 LDT,本设备未环回。问题现象:端口入方向和出方向流量持续增大,LSW1 LSW1 LSW2 移框式交换机盒式交换机第三步是否可以通过环路检测发现环路框式盒式环路问题发生后如何快速破环第一步是否理解网络业务并明确拓扑第二步是否需要用影响最小的方法破环方法一端口退出成环破环方法二成环端口破环方法三工操作引入环路第二步是否由于近期修改配置引入的环路第三步是否典型的常见环路问题交换机自环出现环路交换机下游设备自环出现环
47、路环形组网链路震荡导致环收敛震荡环形组网寄存器下发失败无法破环链路单通引入网络单向后网络是否需要优化第一步是否需要部署适当的破环协议第二步是否需要提升链路质量和可靠性第三步是否需要部署广播抑制提升网络健壮性第四步是否需要部署保证协议报文优先转发结束语介绍以太网链路由于各种原因导致数据LSW2 LSW1 LSW3 环回链路在下游。问题原因:下游链路环回或者自环。处理方法:1、首先逐跳向下游寻找环路的链路。1、然后在端口下去使能 loopback internal。2、设备由于链路引入环路有两种:一种是单端口收发环回。第二种是设备上两个端口环路。此类环路造成的原因是光纤或者网线误接,需要拆除连线。
48、433 环形组网链路震荡导致环收敛震荡 :理论上的堵塞端口 0计算的堵塞端口 图5:环路堵塞端口存在振荡 前置条件:设备部署 STP RRPR SEP或者SMLK等破环协议。问题现象:环路一段时间收敛正常,一段时间收敛失败,或者持续震荡。问题原因:网络上链路存在震荡,导致环网协议报文转发失败,反复超时震荡。如:1、链路存在错包,协议报文被丢弃。2、未知单播抑制、不合理的 qos等配置丢弃协议报文。处理方法:1、如因为错包丢弃,建议更换问题网线、光纤或者光模块。2、如因为被抑制丢包,建议修改单播抑制和不合理的 Qos配置。3、观察当前网络带宽,确认是否是网络流量拥塞,导致协议报文丢失,超时放开堵
49、塞 端口导致临时环路,此类问题需要进行网络优化。4.3.4 环形组网寄存器下发失败无法破环移框式交换机盒式交换机第三步是否可以通过环路检测发现环路框式盒式环路问题发生后如何快速破环第一步是否理解网络业务并明确拓扑第二步是否需要用影响最小的方法破环方法一端口退出成环破环方法二成环端口破环方法三工操作引入环路第二步是否由于近期修改配置引入的环路第三步是否典型的常见环路问题交换机自环出现环路交换机下游设备自环出现环路环形组网链路震荡导致环收敛震荡环形组网寄存器下发失败无法破环链路单通引入网络单向后网络是否需要优化第一步是否需要部署适当的破环协议第二步是否需要提升链路质量和可靠性第三步是否需要部署广播
50、抑制提升网络健壮性第四步是否需要部署保证协议报文优先转发结束语介绍以太网链路由于各种原因导致数据4.3.5 链路单通引入 RRPP 网络单向环 图6:环形网络无法破环 前置条件:物理环路,协议已经破环。问题现象:网络数据风暴 问题原因:软件计算堵塞端口正确,但是芯片下发失败。处理方法:此类问题极其少见,可以通过 shutdown、undo shutdown期望的堵塞端口,观察协议是否收敛成功。故障的单通端口 图7:链路单通造成的 RRPP环 前置条件:RRPP组网 问题现象:RRPP堵塞端口超时放开 问题原因:RRPP心跳检测方向,链路单通。处理方法:解决单通链路问题。该问题有两个规避方法:1