《网络通信模块故障定位手册(共26页).doc》由会员分享,可在线阅读,更多相关《网络通信模块故障定位手册(共26页).doc(26页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上技 术 文 件 技术文件名称:网络通信模块故障定位手册 技术文件编号: 版 本:V2.0 文件质量等级:共 24 页(包括封面) 拟 制 审 核 会 签 标准化 批 准 深圳市中兴通讯股份有限公司前 言SDH是一个将复接、线路传输及交换功能结合在一起的综合信息网,其丰富的功能和优越的性能只有通过先进的网管系统才能体现出来。SDH强大而灵活多变的组网能力,必然带来网络结构的复杂,作为网管信息通道的ECC协议栈自然成为SDH网管系统中最复杂也是最核心的技术。在使用ECC协议栈时,通常会出现不通的现象,如何快捷方便的定位故障,我们提供了一系列的TELNET调试命令,可以很好
2、的定位故障或有助于故障的分析。 本手册的读者主要是为采用ECC协议栈模块在嵌入式领域进行底层板级通讯应用程序开发的人员提供故障定位的方法。 本手册的结构本手册分为两大部分。第一部分介绍了网络通信模块的体系结构。从这一部分大家可以对ECC协议栈有一个整体了解,便于理解定位故障的手段。第二部分详细介绍了ECC通信模块故障定位的常用命令。此部分主要涉及2500C设备的ECC调试命令,详细说明了各个命令的用法并举例说明,能够对开发人员正确快捷的使用各个TELNET调试命令来定位故障打下了基础。第三部分介绍ECC通信模块故障定位的常用方法,并举例说明了如何利用调试命令来定位故障。目 录第一章 网络通信模
3、块的体系结构目前中兴的SDH设备的网络通信模块主要由ECC模块实现,采用的是TCP/IP协议来实现各个网元之间的互联。从硬件角度来看,后台网管到各个网元的之间的通信硬件体系如图1.1。后台网管通过网口与网元1相连,通过SOCKET套接字实现后台网管与前台软件之间的信息交互;网元1和网元2之间是通过光纤相连,物理上是通过SDH的帧结构中的DCC1DCC3(DCC1DCC12)字节,采用TCP/IP协议来实现网元之间的互联,各个网元相当于一个简单的路由器,能够独立的实现路由选择。在各个网元内部,ECC模块涉及两块单板,一块是NCP板,一块是光板,NCP板与光板之间采用总线或点对点方式实现连接,NC
4、P板的网管信息、链路层协议维护信息及OSPF路由协议信息,都要通过光板实现存储转发,由FPGA将这些信息嵌入到SDH的帧中。图1.1 ECC通信模块体系结构在实际中,将NCP到光板186侧的通讯口称为ECC口,186到FPGA侧的通讯口称为DCC口,NCP发送的数据信息经过HDLC总线,由186的ECC接口实现接收,然后采用SDMA方式送给FPGA,FPGA收到的数据信息经过HDLC总线,由186的DCC接口实现接收,然后采用SDMA方式送到ECC侧的HDLC总线上。详细的 186侧转发模块的结构如图1.2。图1.2 186转发模块结构从上图可知,由于环节较多ECC故障比较难定位,我们又缺乏有
5、效的测试仪表,目前的仪表只能测试线路上与开销有关的错误,无法测试上图所示环节的故障,故利用软件编写了一个ECC维护、调试模块希望对定位和解决相关故障有所帮助,特别提醒大家注意接收帧错误的类型,在实际调试中出现的比较多,在上电、复位和拔插光纤的过程中偶尔出现错误是正常现象不用理会,只有当错误的记数在较长的时间内持续增长时才表明有错,超时和CTS类的错位只要出现的频率不是很高可以不理会。第二章 ECC通信模块故障定位的常用命令对于不同的SDH设备,ECC通信模块故障定位的常用命令也不尽相同。21 2500C设备主要的命令1help命令命令用途: 显示所有的TELNET调试维护命令;命令格式: he
6、lp;命令示例: 图2.1 help命令示例说明:显示了ECC的所有调试和维护命令,可以方便查询ECC调试和维护命令。2ifconfig命令命令用途: 用于查看那些端口已经建立连接;命令格式: ifconfig -a;命令示例: 图2.2 ifconfig命令示例说明:图2.2中,1、2、3、4、37表示该网元的所有端口序号;1端口表示以太网;2、3、4端口表示串口(光口或电口,对应于通道PPP0、PPP1、PPP2),37端口表示本地环回地址。其中POINTTOPOINT,UP表示点到点协议已经运行,端口已经被打开(及已经和对端建立点到点连接),若此时本端和对端的端口地址一样通常表示此端口的
7、收与发相连(即端口被环回),利用端口环回通常可以检测端口的好坏(二型机特别要注意2.5G的光板和LP板,尤其是在做中继时,二型机有极少数的光板插在槽位上会导致此网元所有光方向的ECC都不通),若无UP则表示PPP端口未被打开,PPP通道的连接未建立。若协议的地址分配管理模块发现存在底层的PPP通道,即会给其分配一个通道号(如1、2、3等),并分配一个IP地址,在此通道未被打开(即UP)之前IP地址分配为0.0.0.0,若被打开则根据其所在槽位,由地址分配管理模块给其分配一个有效的IP地址,通常有如下几种情况:a、 端口2(即PPP0),表示PPP0通道存在(相应槽位有单板在位),但从未打开过。
8、b、 端口3(即PPP1),表示PPP1通道存在(相应槽位有单板在位),并且被打开,本端的通道地址为193.193.200.43(通常对应的网元地址为193.193.200.18),对端的通道地址为193.193.201.44(通常对端的网元地址为193.193.201.18)。c、 若本端和对端的端口地址一样,但端口未被打开,则表示此通道以前被打开过,但目前已被关闭。若端口被打开则表示此端口被环回。d、 若本端地址为0,对端端口地址非0,则表示则表示此通道以前被打开过,但目前已被关闭,而且相应槽位的单板已被拔掉。注意:可以将ifconfig a 简化为 if a使用,只要前面字符没有重复的命
9、令可以利用简写输入。3ppptable命令命令用途: 利用此命令可以查看端口配置表;命令格式: ppptable;命令示例:图2.3 ppptable 命令示例说明:PPP0、PPP1、PPP2表示已经创建的PPP通道(与之对应的端口序号为2、3、4),HDLC的收发地址表示光板或其它对应处理板的槽位号,HDLC的收发端口表示光板或其它对应处理板上的相应的端口号。一般情况下HDLC的收发地址都是一样的,若是中继则不一样,状态表示此通道是否被禁止(0表示允许,1表示禁止)。通常将ifconfig和ppptable命令结合起来使用。4sccinfo命令命令用途: 显示NCP板ECC通讯口状态;命令
10、格式: sccinfo ;命令示例:图2.4 sccinfo命令示例说明:channel:逻辑通道号,其与单板的关系科利用ppptable命令查看tx_packets:正确发送的数据包记数tx_dropped:等待发送超时主动丢弃的数据包记数tx_errors: 发送错误的数据包记数rx_packets:正确接收的数据包记数rx_errors:接收错误的数据包记数注意:如果某通道不能正确收发数据则此通道对应的ECC处理单板可能有问题,利用ppptable可以查找ppp通道与单板的对应关系5route 命令命令用途: 可以查看路由配置表;命令格式: route -a;命令示例:图2.5 rout
11、e命令示例说明:如图2.5,127.0.0.1表示本地环回的路由,192.0.0.0和195.0.0.0表示到区域192和195的聚合路由,193.193.0.0、193.193.198.0、193.193.199.0表示区域193内部的网络路由,193.193.199.43和193.193.201.44表示端口的路由。通常有到端口的路由就应该有到此网络的路由。结合图2.3和图2.4我们可以发现到193.193.201.0有端口相连但却无路由,肯定不对,可以检测一下是否与193.193.201.44连接的通道是否不稳定,或通过date等命令检查一下定时器(时间)是否运行正常,或检查一下网络中是
12、否有重复培植的网络地址。6qxinfo命令命令用途: 可以查看与网元相连的网管的IP地址,及其连接状态、最近断链的原因;命令格式: qxinfo n (0-15);命令示例:图2.6 qxinfo命令示例说明:如图2.6,表明与网元相连的网管的IP地址是193.193.198.8。其中自定义错误码如下:#define CONNECT_CLOSE 0x /* 连接被对端关闭 */#define TX_CHECKERR 0x /* 连接由于发送错被强制关闭 */#define RX_CHECKERR 0x /* 连接由于接收错被强制关闭 */#define TXRX_CHECKERR 0x /*
13、连接由于发送和接收错被强制关闭*/其它错误码请查pSOSystem操作系统的相关手册。7ping命令命令用途: 用于查看ppp通道的稳定性;命令格式: ping s host count/timeout;命令示例:图2.7 ping命令示例说明:如图2.6,ping的过程中,如果发现丢包很严重,则此通道有问题,可能是光纤未插好。8date命令命令用途: 用于查询系统和修改时间,注意修改系统时间时要慎重,防止由于8中所述问题导致ECC路由不通;可以查询NCP运行的时间,通过NCP运行的时间可以判断NCP是否复过位。命令格式: date ;命令示例:图2.8 date命令示例说明:注意:由于路由协
14、议在计算路由时需要根据相对时间来判断信息是否失效,所以同一网络中各网元之间的系统时间不能在运行中随意变化且相差很大(目前我们是根据系统时间而不是时钟芯片的时间计算,各网元之间的时间不能超过35年)。要注意目前我们的NCP程序在设置NCP时间有些版本在设置小于2000年的时间时可能会存在正确的设置了时钟芯片的时间,但却没有正确设置NCP上的系统时间从而导致ECC路由不通。这里时钟芯片的时间就是后台网管取上来的时间,而NCP上的系统时间是指NCP上所运行操作系统的时间,可通过调试和维护命令中的date设置和查询。9netstat命令命令用途: 用于查看网络连接情况;命令格式: netstat;命令
15、示例:图2.9 netstat命令示例说明:10arp命令命令用途: 用于查看MAC地址表。;命令格式: arp -a;命令示例:图2.10 arp命令示例说明:11open命令命令用途: 打开特定的PPP接口;命令格式: open PPP接口号;命令示例: open ppp0;图2.11 netstat命令示例说明:12close命令命令用途: 关闭特定的PPP接口;命令格式: close PPP接口号;命令示例:图2.12 close命令示例说明:13enableppp命令命令用途: 启用某个PPP端口。;命令格式: enableppp 槽位号 端口号;命令示例:图2.13 enablep
16、pp命令示例说明:14disableppp命令命令用途: 禁用某个PPP端口;命令格式: disableppp 槽位号 端口号命令示例:图2.14 disableppp命令示例说明:禁用端口,首先关闭该槽位号和端口号所对应的PPP端口,然后将PPP端口的使能状态置为1,除非用enableppp打开该端口,否则不能自动或手动打开该PPP端口。该功能主要用于和其他公司的设备对接时使用,因为可能各个公司所用的网元间的通信协议不一定相同,为了避免其他的设备的ECC信息对我们的系统造成不必要的影响,需要将该端口禁止掉。15sccreset命令命令用途: 先将所有的PPP通道DOWN掉,然后再初始化所有的
17、PPP通道,相当于对所有的PPP通道进行复位;命令格式: sccreset;命令示例:图2.15 sccreset命令示例说明:sccreset命令是由底层没有准备好的状态,来启动LCP状态机进入到starting,然后底层驱动口关闭,接着重新初始化驱动口和PPP通道,sccreset涉及了驱动层和PPP层的重新初始化和启动。16sccclose命令命令用途: 关闭所有的PPP通道;命令格式: sccclose;命令示例:图2.16 sccclose命令示例说明:sccclose 命令是由上层(管理者)来关闭PPP的LCP链路通道,只对链路层协议进行了关闭。17sheap命令命令用途: 检查单
18、板的堆使用情况;命令格式: sheap子架号 槽位号 CPU号;命令示例:sheap 1 3 1图2.17 sheap命令示例说明:Total:总内存字节Used:已分配字节Unused:未分配字节通常可利用此命令来判断是否存在内存泄漏。18memstat命令命令用途: 检查单板内存分配情况;命令格式: memstat 子架号 槽位号 CPU号;命令示例:图2.18 memstat命令示例说明:App_ReqCount: 应用模块申请分配内存次数(目前和S口放在一起)App_MemCount: 应用模块分配的内存总字节(目前和S口放在一起)Sport_ReqCount: S口模块申请分配内存次
19、数(目前包括应用模块)Sport_MemCount: S口模块分配的内存总字节(目前包括应用模块)Ecc_ReqCount: ECC口模块申请分配内存次数Ecc_MemCount: ECC口模块分配的内存总字节通常可利用此命令来判断是否存在内存泄漏,和各模块的内存使用情况。19ds命令命令用途: 检查通讯口的状态;命令格式: ds 子架号 槽位号 CPU号 端口号 命令码 0其中端口为0表示S口,1表示ECC口(ECC模块与NCP相连的通讯口),端口为2到5表示DCC口(与相应光端口的FPGA相连的通讯口);命令示例:a、在Telnet的命令窗口输入没ds 1 12 1 0 0 0,回车,则输
20、出显示窗口显示如下:b、在Telnet的命令窗口输入ds 1 12 1 2 0 0,回车,则输出显示窗口显示如下:图2.19 ds命令示例说明:1、186侧数据显示, ECC口产生了次接收和次发送,其中在发送中出现了次帧错误、接收溢出次数,发送中出现117次超时错误。2、186侧数据显示,DCC口产生了次发送和次接收,其中发送没有出现错误;接收出现了141次错误帧,120次接收缓冲区溢出,1次帧接收长度错,4次接收缓冲区溢出。其中:Rx:接收正确记数RxErr:接收错误记数RxErrOv:BD表接收缓冲区地址错记数RxErrLe:接收长度错记数RxErrRa:接收地址错记数记数RxErrFe:
21、接收错误帧记数(包含帧错误、CRC校验错、OverFlow等,详见附件)。RxErrRfo:接收缓冲区溢出记数;对扩展控制器表示Receive Frame OverflowRxErrRfs:接收阻塞自动恢复记数;对扩展控制器表示Receive Frame Start记数Tx:发送正确记数TxCts:发送冲突记数TxErr:发送错误记数TxErrTo:发送超时记数TxErrBa:BD表发送缓冲区地址错记数TxErrRa:BD表发送环地址错记数TxErrXmr:内存分配失败;对于扩展控制器表示Transmit Message Repeat记数TxErrXdu:发送端口号错误;对扩展控制器表示:Tr
22、ansmit Data Underrun记数。TxErrNb:发送阻塞自动恢复记数;对扩展控制器表示:发送缓冲区不可用注意:在目前采用接收溢出丢包的策略下发送超时不一定会引起丢包的发送错,以前采用发送超时丢包会引起丢包的发送错。 如果发送或接收正确记数一致保持不变,则可能出现吊死情况20commreset命令命令用途: 复位通讯模块;命令格式: commreset 子架号 槽位号 CPU号 通讯模块标识其中通讯模块标识为1表示复位S口模块,为2表示复位Ecc模块。命令示例:图2.20 commreset命令示例说明:单板186侧S口模块和ECC口模块复位,用于确定是否是S口或ECC口模块程序的
23、问题。21sid命令命令用途: 读HDLC寄存器;命令格式: sid 子架号 槽位号 CPU号 HDLC寄存器地址命令示例:在Telnet的命令窗口输入 sid 1 12 1 fc80,回车,输出显示窗口显示地址为fc80的寄存器的值示例说明:22sod命令命令用途: 写HDLC寄存器;命令格式: sod 子架号 槽位号 CPU号 HDLC寄存器地址其中通讯模块标识为1表示复位S口模块,为2表示复位Ecc模块。命令示例:在Telnet的命令窗口输入 sod 1 12 1 fc80 4,回车,输出显示窗口显示地址为fc80的寄存器的值 图221 sid sod 命令示例说明:在ECC定位故障中该
24、命令还是比较有效的,186侧置外部环回(即将186的收接到发上),就相当于860侧外部环回,这样可以用EPING命令查看是否故障出现在NCP侧,可以将NCP侧的问题和186侧的问题分离开。23 show mem命令命令用途: 显示NCP板与 pNA模块有关的内存;命令格式: show mem命令示例:在Telnet的命令窗口输入 show mem 回车,输出显示窗口显示如下:图2.22 show mem命令示例说明:此命令是由PNA模块通过IOCTL(SIOCGDBSTAT,SIOCGMBSTAT)调用提供对BUFFER和MESSAGE block的统计,图2.22中:20509 20487
25、0 0表明了消息块总数为20509 ,空闲20487,等待次数为0,失败次数为032: 2048 2047 0 0表明了缓冲区类型为32,总数为2048 ,空闲2047,等待次数为0,失败次数为0。利用此命令可以查协议中内存使用情况,来判断sys_config,h中NC_MBLKS和NC_BUFS_n(n=0,32,64,128,512,1024,2048,4096)是否配置合理。24show al命令命令用途:显示与ECC口通讯模块有关的内存;命令格式: show al;命令示例: 图2.23 show al命令示例说明:0/1: 0表示目前分配的块数,1示最大分配块数;x/y:x代表从y中
26、PPP协议层分配的内存块的数量,y数值越大,说明PPP的ZBUF缓冲池中分的内存块越多,如果太多,说明有可能存在内存碎片,导致内存泄漏。25show ser命令命令用途: 显示NCP板ECC底层通道的收发是否存在错误信息;命令格式: show ser;命令示例:在Telnet的命令窗口输入 show al 回车,输出显示窗口显示如下图2.24 show ser命令示例说明:在图2.24中各个项的代表的意义:低层通道号:PPP通道号校验错:接收校验错发送错:发送Underrun接收错:接收Overrun中断:Break Received丢弃:Frame aborted 可用于查看是否驱动层存在接
27、收和发送数据错误的信息,如果大量存在接收帧错误,一般应定位为时钟的问题。26、eping 命令命令用途: 在ECC口实现PING命令,用于测试光纤环回和186侧外部环回及860自环的稳定性和通断状态。命令格式: eping 槽位号 端口号 (数据长度 次数 超时时间);命令示例:图2.25 eping命令示例说明:如图2.25,采用sod来将AMD186的的HDLC的端口置成本地环回,EPING命令能够正常收发,可以用来将186侧和FPGA侧的故障分离开;如果将本网元的光板光纤环回,这个程序就经过FPGA,采用EPING命令PING光板的地址和端口,看是否光纤环回是正常的,如果正常说明FPGA
28、没有问题,如果EPING不通,要查看光纤的连接情况或用sod置186本地环回,将故障分离。26、a-getreset 命令命令用途: 查看NCP板和单板软件复位和硬件复位情况。命令格式: a-getreset CPU号 槽位号 端口号 ;命令示例: 图2.26 a-getreset命令示例说明: 图2.26中,ResetType复位类型有3类,1为硬件复位,2为软件复位,3为其他复位;time为复位的时间记录。此命令有助于在进行ECC大流量测试,查看NCP板和光板是否存在复位。第三章 ECC通信模块故障定位的常用方法一、故障定位的一般方法:1、ping数据包,观察ECC的状况(ECC不通、时通
29、时断或不是走最短路径);2、用ping和tracert命令可以大致判断ECC故障出现在哪两个网元之间;3、用telnet命令分别登陆出现故障的两个网元,用route a、if a、ppptable等命令查看路由是否正确,如果不正确确定是那条路由不正确从而确定是那块光板的问题;4、 用sccinfo命令查看NCP到光板的收发是否正常;5、 用ds命令查看出现ECC故障的光板的详细情况,看看收发是否正常,是否有不正常的性能记数。;6、 复位NCP板是否可以消除故障,如果复位NCP板故障消失,那么可以将故障降级,因为在实际情况下复位NCP一般是不会影响业务的;7、 用commreset命令复位ECC
30、模块看看故障是否消失,可以确定是否是ECC模块的问题;8、 最后复位光板,如果是只有复位光板才能清除的故障问题比较复杂,可能会设计软件、逻辑和硬件各个方面。二、常见故障的定位实例1、PING 接入网元不通a、首先查看主机网口的IP地址和NCP板的IP地址是否在一个子网中,如果没有和NCP板的IP地址在一子网的网口IP地址,需要手动在主机上添加一个与NCP板IP地址在同一子网的网口IP地址(或直接修改主机网卡的网关);b、还可能由于接入网元的IP地址设置存在问题,如果接入网元的端口IP地址和主机IP地址相同,也会出现接入网元网管管不上和PING不通的现象,所以在设置网元IP地址的时候,一般采用x
31、.x.x.18设置,主机IP地址设置为x.x.x.n(1-17),这样设置保证不会出现类似的问题,这类问题比较难定位(除非用调试方式),所以请务必注意。2、 如果管理的网元不是接入网元,网元管不上,如图,网管主机管不上网元B;网管主机网元A网元Ba、首先PING网元B,看是否通。如果不通,TELNET到网元A,用if a和route a命令检查ECC的链路和路由是否建立。如果ECC的路由已经建立,而ping不通,第一步,检查本地的IP地址,查看本地是否有 IP地址和该网元处于同一子网(比如:网元(不是接入网元)IP:192.19.32.18,本地有地址192.192.32.1)就会导致管理不上
32、,如果存在,将该IP地址删掉即可PING通;第二步,如果仍然PING不通,用route print命令查看路由表,是否存在到网元B所在网络的的路由,如果不存在,手动添加路由,第三步,如果使用双网卡,采用设置网关的方法来管上远端点B,可能有时能通,有时不通,因为这时,主机存在两条默认路由,主机在选择路由的时候不知道走哪条默认路由,它会随机选择一条默认路由,造成时通时断的现象;b、用if a和route a命令检查ECC的链路和路由是否建立。如果ECC的路由没有建立, 第一步,查看光纤是否接好;第二步,用EPING命令,采用环回方式查看是否接入网元存在故障,定位故障是出在接入网元A还是网元B。3、
33、 PING小包正常,PING大包不通a、 如果PING 大小为Kbytes以下的包能够通,PING大小为Kbytes以上的包不通,应该是MTU的设置不正确,采用show fec查看MTU的大小;b、 如果MTU大小正确,可能问题出在186单板侧,查看186侧ECC模块分配的BD表的大小是否太小,如果太小可能造成到了固定长度的数据包就发送不出去,一般容易犯的错误是将ECC口的DEBUG方式直接用于单板程序,往往导致BD表太少,大的数据包就发送不出去了。4、 光纤环回,但是EPING不通。下面是2500C调试过程中的一个实例,采用EPING环回定位故障。a、EPING结果b、通过sod修改186的
34、控制寄存器,是186在DCC侧本地自环,进行测试,发现这样if1可以实现自环,接口能够正常的UP,eping命令也可以通。结论:186侧本地环回能够正常的收发,而通过光纤自环就不行,这之间就存在一个FPGA的DCC口,用ds命令查看发现很多错误帧,问题出现在与FPGA连接的一侧,需要找单板人员查找原因。此问题经过和单板人员一起查证,发现ECC默认使用的是D1-D12字节,与公务板默认设置使用的是D12字节,如果采用默认方式,DCC接收到的肯定是错误帧,存在误码。采用TELNET的相关调试命令可以很好的定位故障。三、常见故障的处理办法如果是由于ping丢包导致的网元脱管,有以下可能:l 10G光
35、板使用的扩展DCC字节,解决办法,不使用扩展字节l 二型机设备板件配合问题,解决办法NCP飞电阻、单板飞电阻、更换板件l 2500E设备OL4、OL1光板软件版本的问题,解决办法复位光板或是升级到最新软件版本注意:以上问题表现是固定的网元脱管如果是由于底层PPP协议无法启动导致网元脱管,有以下可能:l 600V2的NCP板使用TI公司芯片的NCP板导致NCP板跑死,TI芯片的标志: l 150V2的NCP板是否存在R32的电阻,如果没有请检查靠近D21芯片,和C46靠近线的焊盘处是否飞上了3k5.1k欧姆的电阻,具体原因和处理方法请见附件 l NCP软件未将单板类型传达给ECC协议模块,现象是
36、telnet中的ppptable命令中没有相应的单板地址,主要是600V2设备存在,解决办法升级NCP板软件和O4CS板软件到最新版本l 单板的ECC口吊死,解决办法复位单板、更换单板或是升级单板软件到最新版本,情况严重必须对故障单板和NCP板进行处理,见附件和l 环回操作导致,见附件l 不知道的因数导致的NCP板或是单板跑死注意:以上问题表现是固定的网元脱管如果不是以上问题,底层的PPP协议正常,但路由表丢失,导致网元脱管,有以下可能:l ECC区域的网元数目太多并且光连接关系复杂(复杂的光连接ECC区域的网元数 目最好不要超过50),解决办法简化和优化区域组网,例如将其拆分成几个各自独立的
37、区域,利用DCC禁止命令禁止掉一些多于的ECC通道l V2软件版本的问题(有内存泄露):大于2002年11月05号,小于2003年7月17号的小型化的NCP软件版本存在内存泄露的问题。 2002年10月以前的小型化设备NCP软件的S口软件存在内存泄露隐患,但在使用数据单板时问题将变得严重。解决办法升级NCP软件到最新版本l NCP软件的路由协议部分存在缺陷,在某些情况下会存在底层通信正常,PPP端口打开,但路由表中无相应的路由,此时通过telnet中的close命令关闭相关PPP端口,一分钟左右故障会消失。解决办法升级NCP软件到最新版本。l IP地址重复,主要是非此网管管理的设备通过ECC通道接入造成的,解决办法利用DCC禁止命令隔离不同的网络l 同一个ECC网络中的区域重复,解决办法改成不重复,见附件。 注意:以上问题表现是脱管的网元是随机的,网元可能时而脱管时而恢复 还有一个问题是ECC正常且稳定,能ping通,能telnet,但网元不能被管理,此问题尚未定位正在查第四章 附 件 专心-专注-专业