《基站系统故障分析与应急预案汇总(共26页).doc》由会员分享,可在线阅读,更多相关《基站系统故障分析与应急预案汇总(共26页).doc(26页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上基站系统故障案例分析与应急预案汇总总则:深圳电信CDMA无线接入网经过近三年的开通运行,为深圳电信提供了大量的维护移动通讯系统的实际工作经验,在总结前期的维护工作、中兴公司相关维护手册的基础上,我们特编制此手册,希望能够对大家在维护工作中遇到的问题和进行系统维护工作有所帮助。 按照基站系统的工作原理,我们将基站系统的故障分为五个部分,包括1、时钟部分2、射频部分3、电源部分4、传输部分5、数字基带部分,以下我们将按照基站的分类进行分别说明。第一节 时钟系统故障1.1 未探测到GPS故障现象在后台的操作维护系统告警管理程序中,出现“未探测到GPS”的未恢复告警。故障分析
2、GPSTM只要电源正常、天馈正常即可正常工作。如果只有未探测到GPS的告警,说明GPSTM与CCM的通信中断,但GPSTM的时钟输出基本正常。造成GPSTM与CCM的通信中断的原因可能是:(1)GPSTM模块与后背板接触不良(2)GPSTM与CCM的后背板连线有问题或接触不良(3)CCM模块与后背板接触不良(4)GPSTM失效(5)数据配置错误。由于系统机架提供了两个GPSTM插槽,而实际配置可能只有一个GPSTM模块。如果数据配置出现与实际配置不同的错误,也会出现告警。故障定位和排除检查物理配置数据,确认该槽位是否确实应该存在GPSTM模块;如果不应该存在GPSTM模块,更改配置数据,并做数
3、据同步。如果数据配置无问题,解决该故障必须到前台处理。倒换或拔插CCM模块,检查CCM模块与后背板接触不良。检查GPSTM与CCM的后背板连线。拔插GPSTM模块,检查GPSTM模块是否与后背板接触不良。用代换法验证是否GPSTM模块失效。1.2 GPS处于时延阶段故障现象在后台的操作维护系统告警管理程序中,出现“GPS处于时延阶段”的未恢复告警。该告警暂时不会影响该基站用户打电话,但会影响切换,也有可能引起该基站服务区和相邻基站服务区内通话用户掉话或通话质量下降或时钟不正确。 故障分析GPS处于时延阶段的告警说明GPSTM模块已启动,GPSTM已探测到天馈,未能跟踪到卫星,未收到卫星定位信号
4、或收到的卫星信号极弱。造成该告警的原因可能有:(1)GPS天线面向天空部分被严重遮挡(2)GPS天线已被供电,但接收、放大卫星信号能力极差(3)GPS馈线能提供GPS天线所需的直流通路,但对GPS射频信号衰减很大(4)GPSTM模块插针与后背板接触不良(5)GPSTM模块失效故障定位和排除(1)检查GPS天线是否被遮挡(2)检查各接头连接部位是否拧紧(3)接头焊接部位是否牢靠可用代换法检查GPS天线的放大性能。拔插GPSTM模块,以检查是否GPSTM模块与后背板接触不良。用代换法验证是否GPSTM模块失效。更换GPSTM模块。典型案例天馈阻挡故障现象枢纽大厦出现GPS均处于时延阶段告警。分析定
5、位处理 该站以前曾多次出现该故障。每次出现故障都通过更换GPSTM解决,但间隔两天到三天后又出现,经实地检查,发现天馈有阻挡,经更改GPS天线安装位置后,该故障未再出现。1.3 GPS天馈故障故障现象在后台的操作维护系统告警管理程序中,出现“GPS天馈故障”的未恢复告警。前台GPSTM面板RUN灯慢闪。该告警暂时不会影响该基站用户打电话,但会影响软切换。也有可能引起该基站服务区和相邻基站服务区内通话用户掉话或通话质量下降。故障分析GPS天馈故障,说明GPSTM模块已正常启动,但未检测到天馈系统。造成该告警的原因可能有:(1)GPS天线失效(2)GPS馈线或跳线在某处开路或短路(3)相关各接头存
6、在接触不良的现象(4)避雷器失效(5)GPSTM模块失效(6)出现外部干扰故障定位和排除用万用表测试连接室外GPS天线的馈线头芯线和外铜皮之间的电压。正常电压一般为5V左右。如果电压正常,用代换法检查GPS天线。如果电压不正常,检查GPSTM模块后背板处射频接口输出电压(此时GPSTM模块不能断电),如果没有,拔插GPSTM模块,如果仍然没有电压,说明GPSTM模块失效。逐段检查GPS馈线系统。通过测量电压的方法可以最终定位故障点。检查顺序可以自GPS天线处逐渐向下到GPSTM模块后背板处射频接口处,也可按反向顺序检查。典型案例新港基站由于馈头松动造成天馈故障故障现象在告警管理中发现该基站出现
7、“GPS天馈故障”告警。分析定位处理到前台基站侧检查,发现GPSTM板GPSALM灯慢闪。上天台检查,发现天馈脱落,重新接好,故障消失。1.4 GPS的1PPS时钟故障,误差超过800ns故障现象在后台的操作维护系统告警管理程序中,CHM出现“GPS的1PPS时钟故障,误差超过800ns”的未恢复告警。该告警暂时不会影响该基站用户打电话,但会影响切换。故障分析GPSTM运行一段时间后如果出现此故障,可判定该GPSTM故障并更换。故障定位和排除更换GPSTM模块1.5 GPS处于预热阶段故障现象在后台的操作维护系统告警管理程序中,出现“GPS处于预热阶段”的未恢复告警。暂时不会影响该基站用户打电
8、话,但会影响软切换。也有可能引起该基站服务区和相邻基站服务区内通话用户掉话或通话质量下降。故障分析GPS处于预热阶段,说明GPSTM模块已启动,GPSTM已探测到天馈并已跟踪到卫星,正在锁定卫星信号。一般GPS模块上电13小时后,此告警消失。如果长时间告警存在,说明GPSTM长时间未能锁定卫星,存在的原因是GPSTM接收到的卫星信号太差。GPSTM接收到的卫星信号太差原因在于:(1)GPS天线面向天空部分被部分遮挡(2)GPS天线已被供电,但接收、放大卫星信号能力变差(3)GPS馈线能提供GPS天线所需的直流通路,但对GPS射频信号衰减比较大(4)GPSTM模块与后背板接触不良(5)GPSTM
9、模块性能下降故障定位和排除检查此告警出现的时间距离现在的时间是否超过3小时。如果未超过3小时,等待时间超过3小时后再检查。检查GPS天馈系统:(1)检查GPS天线是否被遮挡(2)检查各接头连接部位是否拧紧(3)接头焊接部位是否牢靠可用代换法检查GPS天线的性能。更换GPSTM模块。典型案例电信大厦开站时出现GPS预热告警分析定位处理检查各连接线正常,怀疑GPSTM模块与后背板接触不良,更换GPSTM槽位,故障恢复。1.6 未探测到FDM故障现象在后台的操作维护系统告警管理程序中,出现“未探测到FDM(也可能是FDM配置失败)”的未恢复告警。故障分析时钟分配模块接收来自GPSTM的定时信号(数字
10、)和频率信号,并将其复制和驱动以供BTS中各个模块使用。不同的信号采用不同的方法进行分配。时钟分配模块与TRX模块、CCM模块、CHM模块、RFIM模块和GPSTM模块等都有接口。TCM、FDM正常工作首先需要GPSTM正常工作,其次要求CCM对其进行正确配置(通过IC线缆)。另外相关的射频电缆连接正常。故障原因有:(1)数据配置错误(2)一般原因是CCM到FDM的IC线缆故障(3)由于GPSTM后背板插槽不好,引起GPSTM的10M时钟无输出(4)由于运输或其它原因使后背板连线松动引起,GPSTM的10M输出未到达FDM板。与FDM板并无直接关系。故障定位和排除检查数据配置。试用拔插法检查G
11、PSTM与后背板连接是否有问题。用代换法检查是否GPSTM模块失效。试用拔插法检查FDM与后背板连接是否有问题。用代换法检查是否FDM模块失效。典型案例科技园基站开站时由于运输或其它原因使后背板连线松动引起,GPSTM的10M输出未到达FDM板。故障现象开局过程中出现FDM告警信息。分析定位处理从前台能发现FDM板ALM灯亮,后台则出现TRX频综异常告警,无输出功率,不能打通电话。前台插拔FDM无效。经分析为FDM未收到10M时钟输出,打开后背板,发现GPSTM到FDM的时钟线有松动,重新插拔后,故障消失。第二节 射频系统告警2.1 RFE驻波比异常故障现象在后台的操作维护系统告警管理程序中,
12、出现“RFE驻波比一般异常”或“RFE驻波比严重异常”的未恢复告警。该告警会严重影响相关扇区前向性能。如果告警一直存在,必须立即处理。故障分析RFE驻波比一般异常,说明RFE探测到其输出口的驻波比已超过1.5。RFE驻波比严重异常,说明RFE探测到其输出口的驻波比已超过3.0。一般是天馈接线故障。故障定位和排除用驻波比测试仪定位。检查接头。请检查机内跳线、机顶跳线、天馈等接头是否短路、断路、拧紧、有渗水现象。由于连接器可能存在接触不良的现象,导致用驻波比测试仪测试不准。因此检查时,后台密切关注告警,在检查某一接头时告警消失,说明可能该接头处存在接触不良的现象,应该重点检查。典型案例火车站基站由
13、于渗水导致驻波比告警问题排除。分析定位处理 该基站每到下雨后均会出现RFE驻波比告警,但一段时间后该告警自动消失,反复出现,由于该告警与天气有密切关系,判断该基站天馈有渗水现象,经更换该基站馈线后系统恢复正常。2.2 RFE接收链路LNA过欠流故障现象在后台的操作维护系统告警管理程序中,出现“RFE接收链路LNA过欠流”的未恢复告警。该告警会影响到相关扇区反向链路性能。故障分析RFE接收链路LNA过欠流,说明RFE接收链路LNA失效。一般原因是DUV或DIP失效。故障定位和排除更换DUV或DIP。2.3 未探测到RFE故障现象在后台的操作维护系统告警管理程序中,出现“未探测到RFE”的未恢复告
14、警。该告警会影响相关扇区前向和反向性能。故障分析RFE通过TRX与CCM通信,其告警信息通过TRX上报。若TRX探测不到,则相应RFE也探测不到。若TRX正常,则故障原因可能是:(1)无线数据配置错误(2)RFE背板拨码开关错误(3)RFE背板上的与TRX间的缆线松动(4)RFE模块与后背板接触不好(5)RFE模块失效另外同一扇区的两块RFE硬件版本不一致可能会造成其中一块RFE探测不到。故障定位和排除首先确认TRX是否正常。如果TRX不正常,先解决TRX问题,参考TRX的相关故障解决办法等。如果TRX前台和后台均无告警,检查配置数据。拔插告警的RFE,如果告警消失,说明故障原因是接触不好。用
15、好的RFE模块代换。如果告警消失,说明故障原因是RFE模块失效。检查RFE背板上的与TRX间的缆线连接是否松动;可用好的RFE与TRX间的缆线代换。2.4 RFE低功率告警故障现象在后台的操作维护系统告警管理程序中,出现“RFE低功率告警”的未恢复告警。该告警会影响相关扇区前向性能。故障分析RFE低功率告警,指RFE检测到的前向射频信号低于10dBm。该告警原因之一是RFE输入射频信号过小导致。实际常遇到的低功率告警主要是因为基带没信号和功放增益太低故障导致。如果TRX自动定标失败,会出现RFE低功率告警。可能HPA工作异常。另外RFE滤波器失效或监测电路失效也会引起告警。CHM板信道单元异常
16、也会引起告警。故障定位和排除确定是整个BTS的所有扇区都低功率,还是只有一个扇区低功率。查看功率控制参数值和前向发射功率值。如果功率控制参数已经达到255,先降到195左右。关闭使能HPA(多做几次),可以解决HPA保护性关断的问题。如果还是解决不了问题,到前台关闭、打开HPA,并复位TRX。如果还解决不了问题,考虑更换HPA或DUP。检查告警通知,是否配有控制信道的CHM板配置失败,在告警通知消息中有“配置CE失败告警”,此时功率会始终无法升上去。措施:复位CHM,如果无效,复位CCM。典型案例迎宾馆基站由于信道板控制信道问题导致该扇区功率问题故障现象迎宾馆基站第一扇区出现低功率告警,发射功
17、率最多只能加到10dBm。分析定位处理在后台复位 TRX后,自动定标失败。手工增加发射功率,增加到10dBm时,功率控制参数就已经到了255。经过一段时间的观察,发现问题存在于射频子系统中,更换RFE后问题仍然存在,从而排除了功率检测不准的可能。更换HPA,故障依旧。将该扇区控制信道转移到另外的信道板上,该基站恢复正常。2.5 TRX射频频综异常故障现象在后台的操作维护系统告警管理程序中,出现“TRX射频频综异常”的未恢复告警。故障分析TRX射频频综异常的原因有:(1)射频锁相环失锁(2)发信中频锁相环失锁(3)收信中频锁相环失锁如果是输入频综故障,则3个告警将同时上报;若同一基站所有扇区均告
18、警,则是FDM或TCM、GPS出问题。若单个小区告警,较常见的原因是连接器故障导致,可能是背板上的连接器,也有单板上的连接器出故障。TRX没有收到10MHz信号是产生该告警的主要原因。故障定位和排除首先确认是否三个扇区都出现告警。如果是:(1)检查GPS与TCM的后背板连线(2)检查GPS、TCM模块与后背板接触状态(3)用代换法检查是否GPS、TCM模块失效如果只是部分扇区出现告警,则:(1)检查TRX与TCM的后背板连线(2)检查TRX、TCM模块与后背板接触状态(3)用代换法检查是否TRX、TCM模块失效典型案例木棉岭基站出现GPSTM与后背板配合问题故障现象木棉岭前台所有TRX出现频综
19、异常告警,FDM告警。分析定位处理以上告警原因为FDM未收到GPS输出的10M时钟信号引起。检查GPSTM后备板,把GPSTM换一个槽位解决此问题。2.6 未探测到TRX故障现象在后台的操作维护系统告警管理程序中,出现“未探测到TRX”的未恢复告警。故障分析未探测到TRX,表示CCM与RFCM通信不通。可能的原因是:(1)数据配置不正确;(2)TRX在自动定标,自动定标过程中出现该告警是正常现象;(3)有部分RFCM单板由于EPC1故障,会导致断电重启探测不到,需更换;故障定位和排除检查配置数据。如果配置数据正确,重新进行数据同步到CCM。前台复位TRX。拔插TRX。更换TRX。2.7 未探测
20、到HPA故障现象在后台的操作维护系统告警管理程序中,出现“未探测到HPA”的未恢复告警。故障分析未探测到HPA,说明HPA与TRX的通信中断。HPA通过TRX通信,若TRX探测不到,则相应HPA也探测不到。若TRX通信正常,则:(1)数据配置不正确;(2)功放未加电(前面板有电源开关);(3)PPM电源模块异常;(4)HPA模块通信电路失效。故障定位和排除检查配置数据。到前台检查HPA是否在位和上电。通过代换高功放可判断是模块故障还是线缆故障。通过更换PPM可判断是否PPM电源故障。检查功放后背板与TRX间的线缆是否故障。典型故障翠园路基站出现由于I2C总线连接问题导致HPA未探测到。故障现象
21、 翠园街基站出现HPA未探测到现象,该扇区的功率通过后台无法获取,但通过业务观察发现该扇区有用户呼叫。分析定位处理 由于有用户呼叫,判断该扇区HPA工作正常,问题出在该扇区HPA与TRX的I2C线连接上,打开后背板发现该连线脱落,重新插拔,告警消失。2.8 HPA过功率异常故障现象在后台的操作维护系统告警管理程序中,出现“HPA过功率异常”的未恢复告警。故障现象为掉功率,由于输入信号过大,超过功放额定功率,导致过功率关断告警。故障分析如果告警原因为HPA驻波比异常告警,说明功放输出信号驻波过大,导致功放关断。一般都是缆线连接故障导致,或RFE射频输入口驻波比过大。注意发生该故障时,由于功放关断
22、,驻波告警消失。RFE出现低功率告警。CHM板CE单元故障可能会导致过功率告警。具体的CE单元由于性能原因导致在CE单元被呼叫业务占用或者被控制信道占用时,出现异常能量导致HPA功率输出异常,前向功率输出比之开销功率输出有3dB6dB的异常功率提升。在异常功率提升时RFE-DUP功率输出瞬间可以达到46dB左右,过强的功率输出导致HPA过功率告警,进而HPA自动切断输出保护,系统立即进入低功率告警。这个时候会引起相应扇区无功率输出。故障定位和排除首先确认是否由于CE问题而导致的,处理措施:在确认基带信号正常的情况下,在后台利用动态数据管理工具,手动提升TRX前向增益,如果可以使得功放功率到30
23、W800M或20W1.9G,则说明功放模块本身无故障(注意如果只有控制信道,个别情况下可能无法升到满功率,可再增加OCNS)。确认功放模块无问题后,可通过配置OCNS和逐个打电话的方式找出故障CE。正常的前向功率输出随着业务信道占用的多少而变化,一般每扇区在最大业务信道占用下,前向功率输出上升也在3dB以内。平常业务信道占用缓慢变化的情况下,通过基站信息观察可以看到前向功率输出比较规律并且浮动相对比较缓慢。如果未发现CE问题,可通过更换TRX、HPA等解决。典型案例南华小学由于信道板问题导致频繁出现过功率现象。故障现象南华小学基站频繁出现过功率关断现象,经仔细观察和验证,发现当用户占用该基站的
24、第二块信道板时,出现该现象。闭塞该信道板后基站恢复正常。经检查该信道板芯片焊点出现虚焊现象。分析定位处理由于存在信道板导致过功率问题,我们采用闭塞信道板的办法,发现当用户占用第二块信道板时会出现该现象,于是闭塞了该信道板,故障未再出现。经检查该信道板芯片焊点出现虚焊现象。第三节 传输系统告警3.1 未探测到CDSU故障现象在后台的操作维护系统告警管理程序中,出现“未探测到CDSU”的未恢复告警。故障分析CDSU单板每2秒钟向后台报一次CDSU存在消息。而后台如果连续6秒没有收到一次CDSU存在消息,就会显示CDSU告警消息。原因有:(1)没有CDSU单板;(2)CDSU的422连线没有断开(这
25、时CDSU单板RUN灯快闪);(3)CDSU没有上电;(4)如果CDSU所在的系统重新配置过,可能数据配置有问题。故障定位和排除检查数据配置是否正确。检查CDSU单板的连线,保证CDSU正常连接。确认CDSU单板是否上电(一般而言,CDSU无法上电是由于后台配置与物理连接不一致造成的,比如:拨码开关不对,E1连接不对,NIM端口不对等等)。检查传输链路。3.2 典型案例黄贝岭基站由于传输机房2M线接头不好,导致该基站无法正常开通。故障现象基站上电时,前台正常,但后台发现传输未通,不能观测到该基站。分析定位处理前台CDSU指示灯显示正常,DT0绿灯亮。后台BSC的CDSU指示灯显示正常,DT0绿
26、灯亮。两端自环,DT灯正常,后怀疑BTS及BSC的CDSU故障,经检查排除此种可能性。后检查传输机房2M线,发现接头有松动,将该传输接头重新焊接,基站恢复正常。3.3 CDSU-E1不可用告警故障现象在后台的操作维护系统告警管理程序中,出现“CDSU-E1不可用”的未恢复告警。同时CDSU面板ALM灯(红灯)常亮或闪烁,相应的DT灯不亮或闪烁。故障分析CDSU在上电获得后台配置后,会定时对后台配置的E1进行检测,发现有E1故障会上报E1的各种告警。CDSU-E1不可用告警同时会伴随着其它的告警,如E1失步告警等。原因有:(1)相应的E1口没有接E1线(2)E1连接头故障(3)传输故障(4)对端
27、CDSU单板或E1故障(5)对端CDSU单板正在复位(告警会马上恢复)CDSU-E1不可用,根据经验,传输问题的可能性较大。故障定位和排除检查传输链路。检查CDSU单板。检查CDSU单板的E1连线是否正确,保证CDSU正常连接。检查CDSU单板的E1连接与后台的配置是否一致。典型案例E1口鸳鸯线故障现象ZXC10-MSC的DTI板和ZXC10-BSS的SVICM板2M连接,两板指示灯均正常指示,但在调试中发现有2条PCM不可用。分析定位处理DTI和SVICM单板的“DT”指示灯只是监控了单板能收到2M载波信号,但并不能说明收、发连线和设定的对端设备的相应端口物理连接正确。后台告警监控没有发现异
28、常,应该是接成鸳鸯线引起。仔细检查SVICM和DTI间的连线,确实有一对2M线接成鸳鸯线,接正确后2M线链路正常。在排除故障过程中不能只看单板指示灯,因为指示灯并不能反映完整的单板状态。3.4 CDSU的E1信号失步告警故障现象在后台的操作维护系统告警管理程序中,出现“CDSU的E1信号失步”的未恢复告警。同时CDSU面板ALM灯(红灯)长亮或闪烁,相应的DT灯不亮或闪烁。故障分析CDSU-E1信号失步,传输误码率已大大超过10-3。CDSU在上电获得后台配置后,会定时对后台配置的E1定时进行检测,发现有各种E1故障会上报E1的各种告警。CDSU的E1信号失步告警同时会伴随着其它的告警,如CD
29、SU-E1不可用告警等。原因有:(1)E1连接头故障(2)传输故障(3)对端CDSU单板或E1故障(4)对端CDSU单板复位(告警会马上恢复)故障定位和排除检查CDSU单板的E1连线是否正确,保证CDSU正常连接。检查CDSU单板的E1连接与后台的配置是否一致。检查传输链路。检查CDSU单板。3.4 CDSU10-6/ CDSU10-3告警故障现象在后台的操作维护系统告警管理程序中,出现“CDSU10-6告警”或“CDSU10-3告警”的未恢复告警。同时,CDSU面板ALM灯(红灯)可能会闪烁。故障分析CDSU在上电后获得后台配置后,会定时对后台配置的E1进行检测,发现有各种E1故障会上报E1
30、的各种告警。CDSU单板的E1芯片中有计数器,每次CRC校验错误(误码)、计数器累计溢出时告警。以上两个告警的告警类型一致,仅仅是CRC校验的错误计数器大小不一致。说明传输误码程度不一样。CDSU10-6告警的计数器大小为256,CDSU10-3告警的计数器大小为1024。3.5 引起告警原因有:(1)传输质量差(2)CDSU单板E1接口电路故障(3)CDSU单板E1线接地故障(4)干扰引起如机架接地的问题故障定位和排除检查CDSU单板。检查CDSU单板的E1连线是否正确,保证CDSU正常连接。检查机架以及CDSU单板E1线的接地问题。检查传输设备。更换CDSU单板。根据经验,传输的可能性较大
31、。典型案例竹子林基站出现CDSU10-6/ CDSU10-3告警故障现象竹子林基站频繁出现CDSU10-3告警分析定位处理由于竹子林基站采用HDSL传输方式,有可能会出现传输误码的现象,经检查,发现该基站的HDSL设备问题,更换传输设备后正常。第四节 电源系统告警4.1 PPM异常或不在位故障现象在后台的操作维护系统告警管理程序中,出现“PPM异常或不在位”的未恢复告警。故障分析通过后台告警模块观察,如PSMD也同样告警,则可能是SAM板异常或PSMD与SAM板连接的RS485通讯线有问题,或PSMD异常;若PSMD正常,则可能是PPM与PSMD通讯的RS485通讯线故障;PPM故障。故障定位
32、和排除检查PSMD是否有告警。如果有,请消除PSMD的告警。更换PPM。4.2 PSMD异常或不在位故障现象在后台的操作维护系统告警管理程序中,出现“PSMD异常或不在位”的未恢复告警。故障分析通过后台观察,如果所有电源模块全部不在位,而SAM板正常,可能是RS485通讯线的问题或者是PSMD的问题;如果电源模块和SAM板全部不在位,可能是SAM板的问题,如果只有PSMD异常告警,可能是PSMD与BPOWER的接触不好。故障定位和排除检查SAM板是否有告警。如果SAM板有告警,请先消除SAM板告警。更换PSMD。4.3 PSMB异常或不在位故障现象在后台的操作维护系统告警管理程序中,出现“PS
33、MB异常或不在位”的未恢复告警。故障分析未探测到PSMB,说明PSMB与PAM(或SAM)的通信中断。要保证PSMB与PAM(或SAM)的通信畅通,必须满足以下条件:PAM(或SAM)正常、PSMB在位、PSMB正常。通过后台告警模块观察,如SAM(用于BTS)(或PAM,用于BSC)正常,则可能与SAM(或PAM)之RS485通讯线故障,或PSMB故障。由于每层机框的PSMB单板有两块,所以一块PSMB故障一般不会造成机框断电,并且定位检查故障时可以不断电进行。故障定位和排除后台查看是否有SAM(或PAM)告警。如果有,必须先消除SAM(或PAM)告警。到前台关断告警的PSMB单板,将其拔插
34、后再次开电,如果告警消失,说明是接触不良。用代换法换掉故障单板判断是否单板故障。用代换法换掉机框另一块PSMB单板,以判断是否另一块PSMB单板引起告警。如果以上处理无效,检查SAM(或PAM)之RS485通讯线是否故障。典型案例莲塘BSC0中心架出现与其并联的PSMB电源板异常故障现象莲塘BSC0中心架出现右边PSMB异常或不在位告警,拔掉左边PSMB,右边PSMB能够检测到,拔掉右边PSMB,左边正常。分析定位处理更换单板未解决,说明原单板无问题,可能是后背板问题。测试两个PSMB电压,发现两个电源电压有差异,将左边PSMB板换上另一块后,右边PSMB板的告警不再出现。4.4 PSMC异常
35、或不在位故障现象在后台的操作维护系统告警管理程序中,出现“PSMC异常或不在位”的未恢复告警。故障分析未探测到PSMC,说明PSMC与SAM的通信中断。要保证PSMC与SAM的通信畅通,必须满足以下条件:CCM板正常、CHM和CCM软件版本适合、CHM板硬件版本适合软件版本、CHM板在位。通过后台告警模块观察,如PSMD也同样告警,则可能SAM板异常或PSMD与SAM板通信之RS485通讯线有问题,或PSMD异常;若PSMD正常,则可能与PSMD通讯的RS485通讯线故障,或PPM、PSMC故障。故障定位和排除检查SAM板是否正常。检查PSMD是否正常。更换PSMC。第五节 基带数字系统故障5
36、.1 未探测到NCM故障现象在后台的操作维护系统告警管理程序中,出现“未探测到NCM”的未恢复告警。故障分析未探测到NCM,说明主备用NCM均未运行正常或前后台通信中断。故障定位和排除检查NCM是否在位和上电。检查此告警出现是否频繁,是否有前后台通信中断出现。(1)如果有,检查网线与HUB;没有,则复位NCM。(2)检查NCM的RUN灯运行情况,如果运行正常,说明NCM的软件版本和后台不兼容。重新下载软件或更换后台版本。(3)如果问题还不能解决,更换NCM。以下是NCM单板上电时RUN灯运行情况及含义:(1)1s内闪烁3次-单板上电时出现,表示BOOT正在运行。如果单板上电时运行灯未闪烁3次,
37、一般表示该板进入调试模式或BOOT芯片故障。解决方法:更换单板。(2)灭-BOOT开始装载FLASH中的版本程序。如果单板闪烁3次后RUN不亮,表示此板中无版本程序。更换单板或通过超级终端下载版本程序。(3)常亮-版本开始运行并试图得到地址。快闪(周期0.3s)-正常运行。 典型案例 莲塘机楼1X升级时出现NCM未探测到告警 故障现象 莲塘机楼在升级完1X版本时,呼叫正常,但几分钟后出现NCM未探测到告警,不能进行前后台同步操作和软件下载操作,但呼叫仍然正常。 故障分析定位 在前台观察,发现NCM处于快闪状态,说明单板本身无问题,在后台PING前台NCM逻辑地址,不能PING通,怀疑前后台通讯
38、中断,检查HUB到NCM连线,发现BSC机架背板连接到主用NCM连接处有松动,重新插拔后正常。 5.2 NCM主备通信故障故障现象在后台的操作维护系统告警管理程序中,出现“NCM主备通信故障”的未恢复告警。该告警不影响打电话。故障分析NCM主备通信故障,说明主用NCM正常,备用NCM与主用NCM的通信失败。重点通过NCM的指示灯来判断故障。告警原因可能是:(1)NCM备板未插(2)NCM上的串行通信控制器坏(3)备板发起过复位故障定位和排除诊断测试NCM的主备通信是否正常。数据库配置了NCM备板,检查前台NCM备板是否插好。检查备用NCM是否在位和上电。检查备用NCM的RUN灯运行情况:(1)
39、如果异常,通过RUN灯的运行情况判断故障所在。此时一般极快闪(周期70ms)。复位备用NCM。(2)如果备用NCM的RUN灯运行正常,说明备用NCM单板正常,但版本软件和主用版本软件不兼容。重新下载软件版本到备用NCM上。如果复位无效,查询备用NCM单板软件版本是否和主用一致。如果主备NCM版本一致则更换NCM板,并重新下载软件版本到备用NCM上;如果不一致,运行软件下载程序,使主备NCM版本一致。5.3 NCM网关异常故障现象在后台的操作维护系统告警管理程序中,出现“NCM网关异常”的未恢复告警。故障分析造成告警的可能原因有:(1)单板故障,NCM、NIM或TCM(2)连线问题,背板上TCM
40、与NCM的连线(3)干扰问题。NCM端口外接连线被强信号感应干扰故障定位和排除如果是未恢复告警,观察后台,看具体是何种错误,如果是CHIP时钟错误告警,倒换NCM,如果问题解决,问题可能与NCM或连线有关系(1)检查TCM与NCM的连线是否正确(2)更换NCM(3)更换TCM与NCM的连线(4)如果倒换NCM不能解决问题,可能TCM或连线有关系(5)检查TCM与NCM的连线是否正确(6)更换TCM(7)更换TCM与NCM的连线如果是CO帧长错误:(1)检查背板NIM上有没有未接单板的的RS422线,若有则拔掉(2)检查背板中间的一排电容是否焊接完全(3)检查NIM的版本,有非法版本就更换(4)
41、依次复位NIM,观察是否有复位到其中一块就恢复,更换该NIM(5)倒换NCM或更换NCM其它故障:(1)检查背板中间的一排电容是否焊接完全(2)依次复位NIM,观察是否有复位到其中一块就恢复,更换该NIM(3)倒换NCM或更换NCM如果是已恢复告警而且告警频繁,和未恢复告警同样步骤处理;如果告警频率比较低,注意观察,可以不做处理。典型案例莲塘BSC0出现NCM网关异常告警解决故障现象莲塘BSC0 出现NCM网关异常告警,显示原因为“NCM网关CO帧长错误”。分析定位处理倒换NCM,故障未恢复,晚上复位NIM,发现复位到最边一块新加NIM时故障消失,检查该NIM硬件版本,发现NIM的版本与其余N
42、IM不同,升级该板件版本,故障消失。5.4 未探测到NIM故障现象在后台的操作维护系统告警管理程序中,出现“未探测到NIM”的未恢复告警。故障分析未探测到NIM,说明NIM与NCM的通信中断。故障原因一般是NIM和NCM的IC总线通信出现问题。NIM超过一个时间没有通过IC应答NCM,NCM就发出“未探测到NIM”的告警。故障定位和排除由于挂在IC总线上的任何单板IC出现故障,都有可能影响IC通讯,因此解决办法可以:(1)按照顺序复位TCM、NIM和NCM(2)如果问题无法解决,按照顺序拔掉TCM、NIM和NCM,以确定故障单板(3)如果仍然无法解决,可能是背板问题5.5 未探测到CPM故障现
43、象在后台的操作维护系统告警管理程序中,出现“未探测到CPM”的未恢复告警。如果未探测到的为备用CPM,则不影响打电话;如果主板出现未探测到CPM,且不能恢复,则影响整个系统的运行,系统肯定不能打电话。并可导致电源板、温度、湿度等环境告警异常。故障分析未探测到CPM,说明CPM与NCM的通信中断。如果未探测到的是备板CPM:(1)CPM通信的双口RAM损坏(2)数据库配置了CPM备板,但前台未插(3)CPM板坏或槽位坏,导致备板CPM不能起来如果未探测到的是主板CPM:(1)NIM节点7或8端口6的422线断(2)CPM板坏(3)连接CPM的NIM板坏,而前台没有插可供倒换的NIM备板出现“未探
44、测到CPM”可能有以下几种原因:(1)CPM模块未上电(或不在位)(2)CPM模块与后背板接触不良(3)CPM和NCM软件版本不匹配故障定位和排除如果未探测到的是备板CPM:(1)备板CPM运行灯是否快闪,如是可能双口RAM损坏导致主备通信不正常。(2)检查是否数据库配置了备板CPM而前台未插板。(3)诊断测试主备通信链路否正常,有确认帧或无确认帧是否有丢失,是否有误帧率。如果未探测到的是主板CPM:(1)前台主CPM运行灯是否快闪。(2)诊断测试与NCM的链路否正常,有确认帧或无确认帧是否有丢失,是否有误帧率。(3)前台倒换CPM看是否恢复正常,如果恢复正常说明原来为主用的CPM后背板RS4
45、22线可能有问题或没插好。(4)检查告警通知是否有CPM上电通知,如有说明CPM发起过复位。检查CPM模块是否上电(或在位);检查CPM模块与后背板是否接触不良;检查CPM和NCM软件版本是否匹配;更换CPM模块。典型案例 2001年12月31日,由于大话务量的冲击,莲塘BSC出现阻断,后台出现了CPM未探测到告警,前台无法进行呼叫。采用关断总电源重启方法恢复但未能成功,于是采取最小配置重启的方式进行,只留下一块主用CPM,一块NCM、两块NIM,两块CDSU和对应的声码架板件进行重启,前台恢复正常。5.6 CPM主备通信故障故障现象在后台的操作维护系统告警管理程序中,出现“CPM主备通信故障”的未恢复告警。故障分析CPM主备通信故障,说明主用CPM已启动正常,但备用CPM与主用CPM的通信中断。出现“CPM主备通信故障”可能有以下几种原因:(1)CPM模块内部跳线XJ1/XJ2上的跳线帽没有去掉(2)CPM模块与后背板接触不良(3)CPM模块失效(4)主备CPM运行的软件版本不一致故障定位和排除检查CPM模块内部跳线XJ1/XJ2上的跳线帽是否去掉;检查CPM模块与后背板是否接触不良;检查主备CPM运行的软件版本是否一致。如果不一致,运行软件下载程序,使主备CPM运行的软件版本一致;更换CPM模块。5.7 未探测到SVICM故障现象在后台的操作维护系统告警管理程序中,出现“