《MA5100案例集.pdf》由会员分享,可在线阅读,更多相关《MA5100案例集.pdf(19页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 MA5100案例集案例集 MA5100 案例集 目 录 华为技术有限公司 版权所有,未经许可不得扩散 i目 录 第 1 章 MA5100 故障处理案例.1 1.1 5100LAN 口上行光电转换器端口吊死导致业务中断.1 1.2 ARP 攻击导致 MA5100 的网管时通时断.1 1.3 BAS 将用户 MAC 禁止导致用户拨号 678 错误.2 1.4 MA5100 H511LAND 丢弃 RIP 协议报文导致通过 MA5100 连接的两个路由器不能 ping 通 3 1.5 MA5100 SEP 板工作不正常导致从框业务不通.3 1.6 MA5100 端口设置不一致造成用户上网丢包.4
2、1.7 MA5100 由 8850 割接到 MA5200F 后 telnet 不通.5 1.8 环路问题导致 MA5605 设备业务和网管阶段性中断.5 1.9 上行端口的选择错误导致光口无法激活.6 1.10 因温度变低导致光缆收缩引起 MA5100 定时掉线.7 1.11 由于 MA5100 的 ADSL 端口上行流量很大导致 ping 网关的延时大.7 1.12 由于传输设备对 VLAN ID 进行限制导致 LANC 板用户无法上网.8 1.13 由于低端路由器绑定了静态 ARP 导致 MA5100 上的 VPN 专线业务不通.9 1.14 由于第三方网管原因导致 MA5100 的 AD
3、SL 端口状态不停变化.10 1.15 100 接入用户恶意攻击导致其他用户异常掉线.10 1.16 ADSL MODEM 环路造成 MA5100 下用户上网速度缓慢.11 1.17 MA5100 链路聚合时因为组网中使用了光电转换器导致出现异常.13 1.18 MA5100 下网吧更换网关服务器内外网卡导致用户无法上网.13 1.19 MA5105 因为视频服务器突发流量太大导致用户看电影不流畅.14 1.20 由于 MA5200G 和 MA5100 对 IGMP 处理的不同导致用户组播业务互相影响的问题.15 MA5100 案例集 第 1 章 MA5100 故障处理案例 华为技术有限公司
4、版权所有,未经许可不得扩散 1第第1章章 MA5100 故障处理案例故障处理案例 1.1 5100LAN 口上行光电转换器端口吊死导致业务中断 标题:5100LAN 口上行光电转换器端口吊死导致业务中断口上行光电转换器端口吊死导致业务中断 序号:SC0000209781 产品族:宽带 产品:MA5100 故障类别:ADSL 接入业务(LAN 上行)现象描述:用户组网:5100光电转换器2403HMA5200F。5100 采用 LAND 板的 FE 口上行接光电转换器;5100 隔一段时间便出现网管和业务都不通现象,重启 5100 后便正常,但隔一段时间该故障会再次出现。告警信息:无 原因分析:
5、1、5100 硬件故障,导致业务中断。2、上层设备 2403H 受到攻击、环路等异常导致接 5100 端口阻塞。3、上层 BAS MA5200F 问题。4、线路传输问题。处理过程:1、通过查看现场组网情况,2403H 接多台 5100,其余 5100 都没有出现问题。查看 2403H日志和告警,也无环路等异常告警,基本可排除上层设备 2403H 和 MA5200F 问题。2、据现场用户工程师反馈业务中断时 5100 各单板指示灯无相关告警。因局点较远且局方没便携现场查看情况,问题不能准确定位。3、查看 5100 告警信息,无异常告警只有重启后单板注册的信息。且 5100 重启后可正常运行一段时
6、间。可初步判断非 5100 硬件故障。4、在此情况下可首先考虑光电转换器问题,光电转换器若出现吊死的情况,5100 也会出现业务中断但没有告警的情况。5、更换光电转换器并修改 5100LAND 板的 FE 口和光电转换器端口的协商模式为强制百 M后,观察 3 个月左右没有再次出现问题。建议与总结:若 5100LAN 板 FE 口接光电转换器出现业务中断的情况,到现象后先不要重启 5100,拔插一下网线查看业务是否可以恢复,若可以正常恢复,则肯定是协商问题,一般情况下需要更换光电转换器来解决 1.2 ARP 攻击导致 MA5100 的网管时通时断 标题:ARP 攻击导致攻击导致 MA5100 的
7、网管时通时断的网管时通时断 序号:SC0000368571 产品族:宽带接入 产品:MA5100 故障类别:主机/网管系统(业务无关)关键字:ARP MA5100 案例集 第 1 章 MA5100 故障处理案例 华为技术有限公司 版权所有,未经许可不得扩散 2 现象描述:某局组网是 BAS-S3528-S3026-多台 DSLAM,DSLAM 都在同一网段,同一天这几台 DSLAM 同时出现网管不通的情况,偶尔能通一下,但是业务却一直正常。告警信息:%Jul 18 14:04:13 2007 hancheng_S3528 ARP/5/DUPIP:IP address 61.236.234.21
8、7 collision detected,sourced by 00e0-fc80-d4eb on Ethernet0/4 of VLAN290 and 0011-093c 原因分析:ARP 攻击的问题。处理过程:由于多台 DSLAM 同时出现问题并且在同一交换机下,所以直接在交换机上找原因。在交换机上查看告警,可以发现大量 ARP 冲突的告警:%Jul 18 14:04:13 2007 hancheng_S3528 ARP/5/DUPIP:IP address 61.236.234.217 collision detected,sourced by 00e0-fc80-d4eb on Eth
9、ernet0/4 of VLAN290 and 0011-093c。每条告警的 IP 地址与 MAC 地址不同,但是 IP 地址都在同一网段,并且是同一个 VLAN,其中某 个 MAC 地址的告警特别多,顺着这个 MAC 地址查找,发现该 MAC 地址竟然是某个静态用户的 MAC 地址。一般来说,设备的网管 IP 是不会与分配给用户的 IP 在同一网段的,但是该局却将分配给设备网段的其中一个 IP 分配给用户使用了,用户一旦中病毒,就可能导致上面的故障出现。建议与总结:设备网管的 IP 地址段一定不能分配给静态用户使用。1.3 BAS 将用户 MAC 禁止导致用户拨号 678 错误 标题:BA
10、S 将用户将用户 MAC 禁止导致用户拨号禁止导致用户拨号 678 错误错误 序号:SC0000376351 产品族:宽带接入 产品:MA5100 故障类别:ADSL 接入业务(LAN 上行)关键字:678 MAC 现象描述:某局的某几台 MA5100 下挂部分用户常出现拨号 678 错误,且更换网卡或 PC 机就可以拨号成功,但该网卡拿到其他地方可以拨号成功,说明网卡正常。将 PC 格式化重新安装,过段时间又出现。组网:MA5200-6506-MA5100 告警信息:无 原因分析:由于 MA5200 提供了根据过滤用户 MAC 地址的功能,可以手工禁止 MAC,也可以在该地址下的数据包不正常
11、的情况下自动禁止。此次故障就是用户 PC 由于其他原因,发送到 MA5200 的数据包过大或错报太多(如遭病毒)导致 MA5200 自动将该用户的 MAC禁止,即不对该地址来的数据包进行处理,从我们抓包信息也证实了这一点。由于此次问题涉及数通产品和接入网产品,在处理上带来一定的难度。处理过程:1、到故障用户家测试具体现象。用原来的网卡,拨号,提示 678 错误,抓包分析,只有发出去 PADI 报文,且 PC 机的 MAC 地址也无异常现象。修改网卡 MAC 地址或更换 PC拨号,可以正常拨号,说明 DSLAM 到 MA5200 间的物理链路及 PVC 数据没有问题;2、登陆到 MA5100,可
12、以看到该用户的 MODEM 正常激活及 MA5100 可以正确的学习MA5100 案例集 第 1 章 MA5100 故障处理案例 华为技术有限公司 版权所有,未经许可不得扩散 3到用户 PC 的 MAC 地址。再登陆到 6505 上,也可以查看到该用户 MAC 地址,说明问题出在上层设备;3、检查上行有无捆绑链路,若有则需要检查是否有部分链路故障。经检查无捆绑链路;4、登陆到 MA5200,通过 show disabled mac 查看,发现该用户的 MAC 地址在列表中,于是用 no disable mac XXX 删除掉该 MAC 地址,拨号测试,正常。建议与总结:由于导致此类现象的原因较
13、多,需要逐步排查,要根据现象仔细分析。1.4 MA5100 H511LAND 丢弃 RIP 协议报文导致通过 MA5100 连接的两个路由器不能 ping 通 标题:MA5100 H511LAND 丢弃丢弃 RIP 协议报文导致通过协议报文导致通过 MA5100 连接的两个路由器不能连接的两个路由器不能ping 通通 序号:SC0000376489 产品族:宽带接入 产品:MA5100 故障类别:ADSL 接入业务(LAN 上行)关键字:RIP 现象描述:组网结构:路由器H511LANDH513ADCE路由器。问题描述:RIP 路由协议报文不能从上行路由器传送到下行路由器,导致两个路由器无法正
14、常通信,不能正常工作。告警信息:无 原因分析:1、路由器本身的问题,两个路由器之间的配合可能存在问题。2、MA5100 的数据配置不正确,导致传输通道不通。3、MA5100 把路由协议报文给抑制掉了,从而导致路由协议报文无法传送到对端。4、MA5100 不支持透传 RIP 协议报文。处理过程:1、把两个路由器直接连接起来,中间不经过 MA5100,两路由器工作正常。2、检查 MA5100 数据配置,没有发现错误。3、使用 OSPF 协议,故障依旧。4、H511LAND 因为支持组播,RIP 路由协议报文被丢弃,更换 H512LANC 后测试正常。建议与总结:建议如果 MA5100 使用 H51
15、1LAND 板上行,接入用户路由器不要开启 RIP 等路由协议 1.5 MA5100 SEP 板工作不正常导致从框业务不通 标题:MA5100 SEP 板工作不正常导致从框业务不通板工作不正常导致从框业务不通 序号:SC0000292955 产品族:宽带接入 产品:MA5100 故障类别:SEP/SMX 级联业务 现象描述:组网情况:MA5100(IP-DSLAM 上行)-S3552-BAS 某局 MA5100 扩容 9 块 ADCE 板,其中有三块 ADCE 板插在从框 1 中,6 块板子扩容插MA5100 案例集 第 1 章 MA5100 故障处理案例 华为技术有限公司 版权所有,未经许可
16、不得扩散 4 在主框。调测完成后测试业务时发现从框三块业务板下的端口业务都不通。查看从框单板的状态及版本都正常,从框业务板下挂 ADSL MODEM 都可以正常激活,但拨号都提示 678 错误。通过 show cell static port 查看业务端口信元流量,只有向上发出的信元,无回来的信元流量。告警信息:无 原因分析:1、MA5100 adsl 数据配置问题;2、从框业务单板 ADCE 板故障引起;3、LAND 板工作不正常引起;4、SMX 板故障引起;5、可能 SEP 所插槽位背板问题引起;5、SEP 板故障引起。处理过程:1、检查 MA5100 数据配置以及上层 S3552、BAS
17、 上数据都正常,同时更换 MA5100 上正常可以上网端口的 VLAN 到从框端口下故障依旧,排除是 MA5100 以及上端交换机、BAS 数据设置引起;2、对三块单板都复位测试仍旧是端口可以激活,无法成功拨号,三块单板同时坏的情况不大;为进一步排查单板问题,把主框中扩容的单板和从框中一块单板互换,更换后插在从框的业务板下的业务仍不正常,而插在主框下的业务板正常;排除是业务单板问题引起。3、更换从框 SMX 板的端口以及更换 SMX 板,问题仍旧不能解决,排除是 SMX 端口或SMX 板故障原因造成;4、更换 SEP 板所在 14 槽到 15 槽,故障仍旧,同时对 SMX 和 SEP 板升级都
18、不能解决问题;5、因不便中断业务,通过做 MA5100 带内网管到从框 ADSL 端口测试连通性,不能正常通信;做主框下 ADSL 端口到带内网管的 pvc 连接,可以正常通信。同时主框下 ADSL业务正常,通过这次测试也说明了故障与 LAND 板无关。6、更换 SEP 板后,重新测试从框下三块业务板端口,业务都正常。建议与总结:此次从框业务不通的故障是由于 SEP 板工作不正常导致,但是通过 SEP 板级连的从框业务单板、SMX 板都可以正常注册,也可以对从框 SMX 板升级、对从框业务板和端口都可复位、去激活操作,可见此次 SEP 板故障只是影响了业务开通这一部分功能,也会在一定程度上影响
19、对故障的判断,希望大家注意这类情况。1.6 MA5100 端口设置不一致造成用户上网丢包 标题:MA5100 端口设置不一致造成用户上网丢包端口设置不一致造成用户上网丢包 序号:SC0000378571 产品族:宽带接入 产品:MA5100 故障类别:ADSL 接入业务(ATM 上行)关键字:5100 丢包 现象描述:组网:MA5100cisco2950 交换机cisco3550BAS 用户上网时出现丢包现象,丢包率为 4%左右。告警信息:无 原因分析:1、MA5100、交换机上数据配置出现问题。2、MA5100 主控板故障。3、MA5100 和交换机的端口设置不一致。处理过程:1、仔细核查
20、MA5100 上的数据,让客户配合检查交换机上的数据,全部正常。MA5100 案例集 第 1 章 MA5100 故障处理案例 华为技术有限公司 版权所有,未经许可不得扩散 52、MA5100 上的所有单板状态正常,现场查看所有单板也无告警。3、更换 MA5100 的主控板,导入数据后丢包率有所下降,但丢包现象仍存在。4、查看 MA5100 上的端口模式,发现为全双工 100M 强制模式,让客户查看对端交换机的模式为自适应全双工 100M 模式,更改交换机上的端口模式为强制模式后问题依旧,更改 MA5100 的端口模式为自适应后问题解决。建议与总结:在 MA5100 出现类似问题时,要注意检查端
21、口的模式包括对端设备的模式,有时可能就是一点小小的问题造成了很大的效应。1.7 MA5100 由 8850 割接到 MA5200F 后 telnet 不通 标题:MA5100 由由 8850 割接到割接到 MA5200F 后后 telnet 不通不通 序号:SC0000372909 产品族:宽带接入 产品:MA5100 故障类别:主机/网管系统(业务无关)关键字:loopback 单通 现象描述:MA5100 由 8850 割接到 MA5200F 后业务正常,网管不通,割接后改变了 IP 地址,网管VLAN 没有改变,故障现象为 MA5100 能 ping 通 MA5200F、MA5200F
22、不能 PING 通MA5100。组网:8512MA5200FMA5100(割接后)80168850-MA5100(割接前)告警信息:无 原因分析:1、由于网络存在互通现象,怀疑有地址冲突情况。2、在 MA5200F 上引用访问列表。3、数据配置问题。4、MA5200F 处理机制问题。处理过程:1、开始 MA5200F 网关地址为 192.168.100.1 MA5100 地址为 192.168.100.254,登录到8850 设备时能 PING 通 192.168.100.1,通过这个地址登录时发现用 MA5200F 的密码不能正常登录,此后确认为 S8016 的一个地址,更改地址为 192.
23、168.188.0/24 网段后问题依然存在。2、查看 MA5200F 是否配置了访问列表,也存在。进一步查看发现登录的地址为 MA5200F的 loopback 地址,带网关地址能 ping 通 MA5100,确认为 MA5200Ftelnet 绑定 loopback地址后处理机制问题导致,其处理机制为:由于在 MA5200F 上配置了 loopback 地址,在MA5200F 往外 ping 的时候所带的源地址是 loopack 地址,而 MA5100 没有把 MA5200F的 loopback 地址加到了访问控制列表里,所以当 MA5200F 的报文过来后,被 MA5100 丢弃;当 M
24、A5100 PING MA5200F 的上行口地址时,MA5200F 反回的报文带的源地址时MA5200F 的上行口地址,而 MA5100 已经把 MA5200F 的上行口地址加到访问控制列表里,所以可以 PING 通。3、在 MA5100 访问列表中配置 MA5200F 的 loopback 地址后问题解决。建议与总结:此问题为 MA5200F 绑定 LOOPBACK 地址的的处理报文机制所导致,设备没有任何异常 1.8 环路问题导致 MA5605 设备业务和网管阶段性中断 标题:环路问题导致环路问题导致 MA5605 设备业务和网管阶段性中断设备业务和网管阶段性中断 MA5100 案例集
25、第 1 章 MA5100 故障处理案例 华为技术有限公司 版权所有,未经许可不得扩散 6 序号:SC0000380150 产品族:宽带接入 产品:MA5100 故障类别:ADSL 接入业务(LAN 上行)关键字:MA5605 环路 现象描述:MA5605 设备每天晚上 6 点左右设备业务中断,拨号 678 错误,白天业务正常。MA5605 版本:MA5600V100R011(5605)B03D095 设备组网:MA5605-3552-5200 告警信息:查询 MA5605 告警信息设备出现业务板故障、业务板恢复正常告警。原因分析:1、主控板问题导致。2、MA5605 设备机箱电源异常导致。3、
26、上行设备 3552 交换机问题。4、设备环路问题。处理过程:1、现场更换主控板 MFEA 问题依旧。2、现场检查 PWR 和 FAN 灯状态正常。3、登陆到上行交换机 3552 上检查配置正确,DIS LOG 查看 3552 有告警信息。%Aug 27 14:29:05 2007 WeiYuan_s3552G DRV_NI/5/LOOP BACK:Loopback does exist on Ethernet0/2 vlan 838,please check it 大量的环路告警出现在 VLAN838 用户上,在 MDF 侧中断外线,MA5605 业务和网管正常。4、协调客户检查电脑和 MOD
27、EM 原因,问题解决。建议与总结:故障定位不要完全依赖 MA5605 上的告警信息,要全流程掌握业务流程,上行设备的告警对定位问题也非常重要。1.9 上行端口的选择错误导致光口无法激活 标题:上行端口的选择错误导致光口无法激活上行端口的选择错误导致光口无法激活 序号:SC0000375407 产品族:宽带接入 产品:MA5100 故障类别:LAN 接入业务 关键字:MA5615 上行口 现象描述:在 MA5615 上连接光口,光口无法激活,在对端能够收到 MA5615 发来的光,但是 MA5615侧光口 active 状态为 NO。告警信息:在设备上使用 show board 0/0 时,显示
28、 fiber 的 active 为 NO 使用 shutdown 指令无法改变其状态 原因分析:MA5615 上行口有电口(copper)和光口(fiber)之分,因此需要对上行口进行选择。设备默认为电口有效,故此时光口处于失效状态,无法激活,需要将上行口选择为光口。处理过程:huawei(config)#interface lan 0/0 huawei(config-LAN-0/0)#uplink-select copper,fiber:fiber Are you sure to change up-link fiber?(y/n)n:y Set uplink port as fiber s
29、uccess.MA5100 案例集 第 1 章 MA5100 故障处理案例 华为技术有限公司 版权所有,未经许可不得扩散 7 建议与总结:注意:1、对于通过 Telnet 方式登陆的用户,该命令不可用,只有通过串口登陆的用户才使用此命令;2、如果上行口已经为光口,仍然使用此命令切换到光口,系统会提示错误。1.10 因温度变低导致光缆收缩引起 MA5100 定时掉线 标题:因温度变低导致光缆收缩引起 MA5100 定时掉线 序号:SC0000223423 产品族:宽带 产品:MA5100 故障类别:ADSL 接入业务(LAN 上行)现象描述:某局宽带 MA5100 设备在每天早 8 至早 10
30、期间用户经常掉线,过 10 点之后自动恢复正常。版本为:H511MMXC B09D061 H511LAND B08D051 告警信息:无 原因分析:因设备定时出现问题,基本判定是周边环境或相关设备引起的问题,所以从传输及机房周围进行检查。处理过程:检查传输时发现,在 8 点至 10 点期间,其中一段光纤光功率衰减过大,经查为其中一根光纤弯曲半径过小,导致在温度较低的情况下光纤收缩引起光功率衰减过大,导致了上网掉线,将光纤重新绑好之后恢复正常。1.11 由于 MA5100 的 ADSL 端口上行流量很大导致 ping 网关的延时大 标题:由于 MA5100 的 ADSL 端口上行流量很大导致 p
31、ing 网关的延时大 序号:SC0000165776 产品族:宽带接入 产品:MA5100 故障类别:ADSL 接入业务(LAN 上行)关键字:上行流量 现象描述:组网:PC(双网卡)-RTU-MA5100-L2-c6509:网吧服务器 PC 的网关指向 C6509,一般是 5 个网吧共一个 VLAN.经常出现有时候用户上网速度很慢,玩在线游戏卡,同时 ping 网关的地址延时比较大的问题。告警信息:无 原因分析:1、怀疑 LAND 单板的逻辑处理有缺陷;2、LAND 单板的转发性能有问题,导致下带的用户往上 ping C6509 的 loopback 地址有时延比较大的情况;3、线路质量比较
32、差导致 ADSL MODEM 频繁的去激活,并且衰减比较大。从而导致用户PING C6509 的地址有时延比较大的情况;4、ADSL MODEM 处理能力不够,当流量比较大的情况下不能够及时处理报文,导致用MA5100 案例集 第 1 章 MA5100 故障处理案例 华为技术有限公司 版权所有,未经许可不得扩散 8 户 ping 上层设备地址出现了时延比较大的问题;5、网吧自身组网有问题,或者是网吧的代理服务器处理能力不够,当流量一大的时候导致用户 ping 上层设备地址有时延比较大的情况;6、vlan 广播域太大,广播报文过多导致网吧用户 ping 上层设备有时延比较大的情况;7、其他。处理
33、过程:1、升级到最新的版本,故障依旧。2、为了进行 LAND 单板的转发性能测试,在 L2 交换机上接了一台 PC1 开启 ftp server 服务,并在 MA5100 的 ADSL 端口上接了一台 PC2,两台 pc 划到同一个 vlan 内进行 ftp 下载测试,测试出来的速度有 4Mbs,排除 MA5100 的 LAND 单板转发性能不够的问题。3、检查用户的线路,一般的网吧距离局端的 MA5100 1 至 2 公里,同时用 show line operation 查看用户线路的衰减都在 7db 之内,属于正常的范围之内。基本可以排除由于线路的原因导致 PING 包时延慢的问题。4、怀
34、疑 ADSL MODEM 的问题,但是有几家网吧反映有时候 ping 上层设备的地址有时延较大的现象,并且有几家网吧已经更换过 MODEM,排除 MODEM 的原因导致 ping 包时延大的问题。5、当网吧出现 ping 包时延大的时候,断开网吧的内网。接到测试便携上时延又正常,说明 MA5100 设备完全正常的。6、导致网吧 ping 包时延偶尔比较大的问题,可以肯定的是由于网吧组网,或者是网吧的代理服务器处理能力不够,或者 vlan 广播域太大导致 ping 包时延比较大。为了证明这个结论,特做了如下的测试。在机房的配线架上打上一个端口,单独分给他一个测试 vlan,vlan 终结到 65
35、09 上。接上 PC 往上 ping6509 的 loopback 地址,经过一天的测试并没有出现连续很多个 ping 包时延大的情况。Ping 默认包的大小一般在 15ms 上下抖动。Ping 1024 字节的大包一般在 30ms 左右抖动。可以证明造成网吧 ping 包时延大的问题并不是由 MA5100 引起的。7、注意到当网吧的 ADSL 端口的上行流量达到 700kbit 的时候,网吧服务器 ping 外网地址就会出现ping时延比较大的情况,由于ADSL技术的限制上行的流量只能这达到800Kbit的流量。问题定位在 ADSL 上行的流量较大的时候导致网吧 ping 外网时延较大,而且
36、网吧的上行流量比较大的时候,很多情况是由于网吧的服务器做 BT 下载导致上行流量变大,停掉 BT 之后 ping 外网就正常了。建议与总结:建议对实际问题做细致的分析,特别是对于 LAND 单板的组网。虽然 LAND 单板存在逻辑处理的缺陷,但是并不是每个问题都由此引起的。对于 ADSL 网吧,由于技术的缺陷上行的流量最大只能达到 800Kbit 左右,所有建议局方走光纤网吧。如果实在不行可以考虑更换 ADSL2+的 H513ADCE 单板来增加上行的带宽,也有一些效果。1.12 由于传输设备对 VLAN ID 进行限制导致 LANC 板用户无法上网 标题:由于传输设备对由于传输设备对 VLA
37、N ID 进行限制导致进行限制导致 LANC 板用户无法上网板用户无法上网 序号:SC0000022197 产品族:宽带接入 产品:MA5100 故障类别:其它 关键字:宽带交换接入 宽带交换接入 MA5100 MA5100 LAN 接入 其它 其它 其它 现象描述:某局MA5100(B09D003)采用IP上行方式组网,中间经过中兴2.5G传输设备,接入MA5200。MA5100LANC 板上原先设置了两个 VLAN,业务 VLAN 22 和网管 VLAN65,业务和网管均正常。在近期扩容中想将 LANC 的其他端口接入网吧用户,但是发现将相应的端口重新划分VLAN 后,用户无法拨号上网。M
38、A5100 案例集 第 1 章 MA5100 故障处理案例 华为技术有限公司 版权所有,未经许可不得扩散 9 告警信息:无 原因分析:首先检查了 MA5100 和 MA5200 的数据,发现没有错误,怀疑 LANC 板有问题,将两个端口包含在同一个 VLAN 中,两台 PC 可以正常通信,通过软件对 MA5100 发出的报文进行检测,发现报文正确,从而排除了 MA5100 和 MA5200 的问题,将问题定位在中间传输设备上,经询问得知中间传输设备对数据的 VLANID 进行了设置。处理过程:1、首先检查 MA5200 和 MA5100 数据配置,无问题。2、在 LANC 板上做新的 VLAN
39、10 的用户,无法上网。怀疑是该 LANC 板有问题,在其他LANC 上做 VLAN10 的用户,无法上网。3、在该 LANC 板上和其他 LANC 上做 VLAN22 的用户,均可以拨号上网。4、通过 sniffer 对 MA5100 发出的数据报文进行分析,发现报文标准,报文携带 VLAN ID 正确,排除了 LANC 板的问题。5、怀疑是中间传输设备进行了限制,在 LANC 板上做 VLAN65 的用户,也可以正常上网,进一步证明了上述怀疑。6、通过询问中间传输厂商的工程师,得知传输设备在进行报文处理时,对 VLAN 进行了处理,必须预先设置,否则无法通过。7、协调中兴工程师将相应 VL
40、AN 作上后,LANC 板上用户可以正常拨号上网,问题得到解决。建议与总结:大部分传输设备对数据都是透传,而此局的传输设备却对报文的 VLAN ID 进行处理,所以日后处理问题时应该抛弃以前认为传输只是透传的观念。1.13 由于低端路由器绑定了静态 ARP 导致 MA5100 上的 VPN 专线业务不通 标题:由于低端路由器绑定了静态由于低端路由器绑定了静态 ARP 导致导致 MA5100 上的上的 VPN 专线业务不通专线业务不通 序号:SC0000376643 产品族:宽带接入 产品:MA5100 故障类别:ADSL 接入业务(ATM 上行)关键字:宽带交换接入 MA5100 vpn 现象
41、描述:BAS 上的 VPN 个别用户无法 ping 通网关,无法访问 VPN 内部服务器。组网概述:BASatmMA5100AadslAR18 路由器PC MA5100A(aiu0/13/0)(mmx)5100BadslAR18 路由器PC 告警信息:无 原因分析:1、MA5100 上 pvc 丢失或者没有配置。2、用户侧路由器的 PVC 和 5100 的 ADSL 端口之间不匹配。3、BAS 上专线业务的封装方式和用户侧路由器封装方式不一致。4、用户侧低端路由器其它问题。5、用户侧终端 PC 问题。处理过程:1、业务不通的节点信息:PVC 和 PVP 信息都终结到 BAS 上了 第一个节点:
42、MA5100A 上 0/3/0-pvc54/128;由 PVC 交换直接到 BAS。第二个节点:MA5100B 上 0/0/21-pvc125/53;由 PVC 交换到 5100A 上,再 PVP 交换到 BAS 上。2、用户侧的带路由功能的 modem 上 PVC 是轮选机制的,并且其中有 5100 端口上对应的PVC。3、用户侧的 AR18 是一款多口的带路由功能的 modem,固定 IP 设置在此设备中,封装方式是 IPOA 的,改为 IPOEOA 后还是不能 ping 通网关。MA5100 案例集 第 1 章 MA5100 故障处理案例 华为技术有限公司 版权所有,未经许可不得扩散 1
43、0 更换用户侧为普通桥接 modem 接 PC 设置固定 IP,可以 ping 通网关(BAS 上虚接口地址),这种方式默认是 IPOEOA 方式。4、检查 AR18 上配置了一条静态的 ARP,IP 地址是 BAS 的虚接口地址,而 MAC 地址却不是,删除后使 ARP 表更新后可以 ping 通网关。最后发现 BAS 之前有割接过,BAS 设备MAC 地址发生了变化,而终端侧用户又配置了一条多余的静态 ARP 将原来 BAS 设备的MAC 地址和网关地址进行了绑定,由于 ARP 表始终无法刷新,导致业务一直不通。建议与总结:目前专线业务中很多故障都与用户侧终端路由器/带路由功能 modem
44、 有关,通常可以将终端侧改为最简单的桥接方式来排除 DSLAM 侧的问题。1.14 由于第三方网管原因导致 MA5100 的 ADSL 端口状态不停变化 标题:由于第三方网管原因导致由于第三方网管原因导致 MA5100 的的 ADSL 端口状态不停变化端口状态不停变化 序号:SC0000376561 产品族:宽带接入 产品:MA5100 故障类别:主机/网管系统(业务无关)关键字:第三方网管 snmp 现象描述:MA5100 的 ADSL 端口状态在 Activating、Deactive、blocked 之间循环变化,不停打印端口状态变化的信息。告警信息:无 原因分析:1、人为下发命令。2、
45、端口故障。3、可能与远程控制设备有关。处理过程:1、首先排除人为下发命令可能性,因为状态是循环变化的。2、其次怀疑端口故障,但是复位单板,更换单板还是相同位置的端口出现状态循环变化,端口问题也排除了。3、最后将所有可能对设备进行操作的地址屏蔽,删除 ACL 所有允许访问的地址,只留下网关地址便于远程控制。端口状态停止循环变化,说明与远程控制设备有关,与 MA5100 设备本身硬件无关。4、将允许访问的 ACL 地址逐个添加,在加到某第三方的网管服务器地址后,端口状态循环变化又复现,说明与第三方网管有关。5、添加回所有允许访问的 ACL 地址,在 NMS 网管服务器配置中将第三方网管地址去激活解
46、决问题。建议与总结:目前运营商为了简化 DSLAM 设备的管理,与第三方开发了一些电子工单和 DSLAM 的管理系统,由于第三方软件存在很多问题所以常导致此类异常现象。若遇到状态循环变化的可以采用断开网管的方法判断,但是遇到用户帐户未到期但是端口无故去激活的,就需要抓取报文,找出 snmp 对应报文来提供证据了 1.15 100 接入用户恶意攻击导致其他用户异常掉线 标题:5100 接入用户恶意攻击导致其他用户异常掉线接入用户恶意攻击导致其他用户异常掉线 序号:SC0000162168 MA5100 案例集 第 1 章 MA5100 故障处理案例 华为技术有限公司 版权所有,未经许可不得扩散
47、11 产品族:宽带 产品:MA5100 故障类别:ADSL Access Service(LAN Uplink)现象描述:某局点 5100 采用 LAND 上接 5200F,所有 ADSL 用户的 PVC 都是建到 LAND 板的同一个小区 VLAN(VLANID 为 2),用户侧采用 PPPOE 方式。用户普遍反映有异常掉线故障 告警信息:无 原因分析:检查 5200F 上配置数据正常,而且其下挂的其他 5100 节点无类似问题,因此故障范围能确定在 5200 以下;每次都是个别用户反映故障,没有该 5100 下全部用户都异常掉线的问题发生,因此能排除 5100 上行链路问题;另外故障用户发
48、生几率较为分散,5100 的软硬件问题可能性也不大,因此重点排查用户侧网络 处理过程:通过在故障用户侧抓包,发现收到 PADT 报文,但相应的在 5200 上通过查看 debug 信息,5200 并没有针对该用户发送 PADT 报文;正常情况下在 LAND 单板上通过 show location 命令能正确查到用户的正常端口(如 0/0/0),但当收到 PADT 报文时,通过 show location 命令查到对应该用户 mac 地址的端口改变了(如 1/0/0),这就能断定是 1/0/0 端口的用户恶意发送 PADT 报文导致 0/0/0 端口的用户业务异常中止;到 1/0/0 端口的用户
49、端检查,发现终端上安装了相应的黑客程序,通过获取到别人 MAC地址和 Session ID,然后构造一个 PADT 报文,来恶意终止其他用户的正常业务 建议与总结:5100 采用 LAND 板上行而且用户侧使用小区 vlan 方式,当某个 ADSL 用户所属的 PVC学到的 MAC 地址老化后,MA5200F 发过来的 Echo Request 报文就会向所有 PVC 广播,因此,其他 ADSL 用户就可以收到本应该发到别的用户的 Echo Request 报文,就能通过黑客工具分析报文中的用户 mac 地址,从而进行恶意攻击 1.16 ADSL MODEM 环路造成 MA5100 下用户上网
50、速度缓慢 标题:ADSL MODEM 环路造成环路造成 MA5100 下用户上网速度缓慢下用户上网速度缓慢 序号:SC0000165061 产品族:宽带 产品:MA5100 故障类别:xDSL MODEM Terminal Interconnection 关键字:MA5100 现象描述:某地市运营商采用我司 MA5100 设备接入 PPPOE 用户,上行与 S3526E 相连,S3526E 做二层透传使用,最近些 MA5100 下用户反映上网速度很慢,还经常掉线。告警信息:无 原因分析:1、MA5100 与 S3526E 间传输问题;2、S3526E 的 CPU 使用率过高;3、S3526E