《爱立信基站典型故障处理案例.doc》由会员分享,可在线阅读,更多相关《爱立信基站典型故障处理案例.doc(6页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、爱立信基站典型故障处理案例案例1:对基站进行IDB的配置总是无法完成,提示为时间超时。当对基站进行IDB数据的配置时,因为TRU与DXU软件版本不一致,或BSC下载软件的同时进行DXU数据配置而产生冲突,或第一次IDB配置电源电压类型错误,或短时间内频繁的对DXU进行IDB配置等原因,偶尔可能导致再进行IDB的数据配置时,出现提示为时间超时而无法完成的现象。导致DXU同机架内部的通信上存在异常现象,出现类似机架掉死的现象,更换DXU无效。解决的办法是,将DXU(或新的DXU)放到同基站的其它机架上,或另外的基站上,仅对DXU加电,按照存在问题的机架配置进行IDB的重新配置,完成后再安装到存在问
2、题的机架上,不必再重新配置,对DXU等各模块加电重起,即可解决问题。案例2:RBS200基站工作不稳定,经常退服。基站各部件的稳定工作离不开稳定的时钟信号,而基站的时钟信号是从PCM传输中提取的,爱立信的基站不提供外部时钟输入的端口, RBS200基站是爱立信早期推出的GSM基站产品,这些基站设备是基于采用传统的PDH传输组网方式而设计的,并不非常适用于SDH传输组网方式,这就会导致RBS200基站在和某些厂家的SDH传输设备配合使用时,导致基站工作不稳定,频繁出现时钟同步的告警,经常退服,严重影响了基站的正常运行。解决办法有两种:一种是将RBS200基站使用的SDH传输更换为PDH传输;另一
3、种是将RBS200基站设备更换为RBS2000基站设备,因为RBS2000对同步要求较RBS200低,能够很好同SDH传输配合工作。案例3:开始时,马厂湖基站有部分TS总是无法正常工作,且不固定在某个载频上,更换TRU、DXU无效,对基站的数据进行拆掉重新加载后仍无效,后来整个基站所有的TS均无法正常工作,基站硬件、传输、数据等均不存在问题。点检查了基站的所有硬件均不存在故障现象,对怀疑有问题的TRU、DXU进行了更换;对传输进行了环路测量,也未发现传输电路存在质量问题;检查小区、基站的定义数据也都正常。怀疑基站的数据存在掉死的现象,但没有确凿的证据。尝试用另外一种方法进行故障的定位。从BSC
4、的ETC传输接口处,即ETRBLT板子2M接口处将马厂湖基站的传输DIP=97同另外一个类似配置的基站装载机厂的传输DIP=98直接进行互换,也就是说互相用对方基站的数据来开通基站。互换后发现,马厂湖基站的数据在装载机厂基站上仍然存在同样的问题,而装载机厂基站的数据在马厂湖基站上却能正常工作。这就可以说明,马厂湖基站的硬件、传输均不存在问题,基站数据确实存在掉死的现象。在确认马厂湖基站的数据存在掉死的情况后,重新定义了新的TG数据,来替换原先存在掉死现象的TG数据,整个基站恢复正常运行。对上述基站数据掉死的解决办法还有一种是进行BSC的重新启动,因为需要在晚上进行,因此可能会导致基站退服的时间
5、较长。案例4:中国银行基站第2小区对应的机架为2个CDU C,4个载频配置,总是在4个载频全部开起来后,又很快全部退服,现象为第1、2个TRU状态为TX not enabled,第3、4个TRU为Fault灯和Operational灯同时亮。每次对DXU进行复位,总是出现上述的同样现象,整个小区无法正常运行。因为第3、4个TRU总是出现故障现象,将这两个TRU更换,仍然出现同样的故障现象;更换第3、4个TRU对应的第2个CDU C,仍然出现同样的故障现象。将第3、4个TRU放到第5、6个TRU的位置上,将第2个CDU放到第3个CDU的位置,这样载频的位置为第1、2、5、6,甩开TRU第3、4位
6、置不使用,整个小区正常运行,不再出现上述故障现象。根据以上处理过程进行分析,应该是第2个CDU C对应的CDU BUS总线或第3、4个TRU对应的背板存在问题,导致第2个CDU C不能正常工作,不仅导致第3、4个TRU不能正常工作,而且导致整个小区不能正常工作。将第2个CDU C对应的CDU BUS总线拆下来,更换一新的CDU BUS总线后,故障解决,确认是第2个CDU C对应的CDU BUS总线存在问题。下图是CDU BUS的连接示意图:还有一种解决办法,就是将CDU C更换为CDU C+,并且使用Y cable,按照如下图连接:这样就可以不再使用第2个CDU C对应的有问题的CDU BUS
7、总线,就不会出现整个小区开不起来的现象。案例5:沂水城东基站A小区扩容一个机架,由6载频扩容为8载频。在打开跳频的情况下,A小区所有8个载频的时隙全部正常工作后很快陆续全部退服,同时出现1A级的XBus Fault告警,但告警很快又消失。对基站A小区复位或闭解CF,仍然是同样的故障现象。将A小区的跳频关掉后可以正常运行。针对出现的XBus Fault告警,重点检查了新增扩的机架TRU和DXU背板跳点设置,CDU BUS的连接情况,均未发现异常,更换DXU也不能解决问题。考虑到当时是在上午忙时,此小区承担的话务量很高,有可能是因为A小区重起时接入用户太多导致负荷过高而不能以跳频方式正常运行,设置
8、A小区参数CB=YES禁止待机时手机接入,设置A小区为Layer=3小区限制其它小区手机用户向A小区切换,这样的参数设置曾经解决过类似大容量小区在打开跳频的情况下忙时重起困难的问题,但仍不能解决沂水城东A小区的问题。怀疑新增扩的2个TRU虽然状态显示正常,但仍然可能存在问题,导致XBbus工作异常。由于A小区的主架的6个TRU和副架的2个TRU间已多次互相倒换位置来排除TRU的问题,已经不能分清哪2个TRU是新增扩的。于是将A小区的所有8个载频全部替换,问题解决。总结:某个存在故障的TRU可以导致其背板连接的总线工作异常,在这个案例中,导致了XBus工作异常,小区不能打开跳频,但是此TRU的状
9、态显示完全正常。解决办法是替换怀疑有问题的TRU,尤其是新增扩的TRU,不要采取在有问题的小区内互相倒换的方式,因为存在故障的TRU无论在那个位置均可以导致同样的故障现象。应该用其它小区或新带来得TRU替换。还有一个例子也是存在故障的TRU导致其背板连接的总线工作异常的情况:某小区新扩一个机架,载频由6个扩容到7个,但是每次启站时总是很快出现驻波比过高的基站告警,所有载频全部退服,故障原因是新扩的TRU(在新扩的副架上)存在问题,虽然表面状态均很正常,但是把它插到机框内加电后,就会干扰背板总线的正常工作,导致出现整个小区驻波比过高的问题产生。案例6:付庄基站为3个RBS2202机架级联、4/4
10、/4配置,故障现象为B小区退服,复位后B小区恢复正常,但几小时后又再次退服,基站不存在任何告警。如此反复,B小区工作状态很不稳定。因为是在基站运行中出现的故障,所以首先怀疑是B小区DXU出现故障,但是更换后仍无法解决。检查B小区的射频电缆、PCM传输电缆、CDU总线均无异常。通过OMT软件监测付庄基站3个机架DXU的PCM连接状态均正常。考虑到B小区是级联A小区的,即PCM传输电缆从A小区DXU的G.703-2端口连接到B小区DXU的G.703-1端口,这段传输通路是否存在问题?更换这段通路上的所有传输电缆,仍不能解决问题。再向前考虑一步,是不是A小区DXU的G.703-2端口存在问题,虽然没
11、有故障状态显示?更换A小区的DXU,重新配置IDB数据后,问题解决。总结:针对多机架级联的基站,第2、3小区退服的情况,要考虑前一级级联的小区所在的机架是否存在DXU故障、PCM传输电缆接错、IDB数据中未定义PCM级联等情况。案例7:某个基站第2小区有3个时隙LMO状态为0800,复位和更换载频后无效。检查基站的定义数据,发现第2小区对应的TG-139,在定义半永久连接关系时,将RBLT-1309与DCP 28连接是错误的,导致DCP 28相对应的4个TS时隙,无法正常工作。应该是RBLT-1308与DCP 28连接,正确修改后,故障解除。类似的故障现象可能还有如下的故障原因:(1)某个基站
12、第2小区4个时隙LMO状态为0800复位和更换载频无效:用DTIDP指令检查DIP的定义数据,发现MODE=1是错误的。RBS200基站的DIP定义为MODE=1,即传输的第16时隙仅用于传信令,不用于传话音。而此基站为RBS2000基站,正确的定义是MODE=0,如果定义为MODE=1,会导致DCP 16,即传输的第16时隙不能正常使用,出现上述的故障现象,或者导致用户占用时出现单通现象。(2)某个基站第3小区2个时隙LMO状态为0800,复位无效:第3小区的2个时隙的故障原因是在定义基站数据时,MO CF的参数SIG=UNCONC错误,因为所有的TRX的SIG=CONC,导致TG分配的DC
13、P不够用。将MO CF的参数该为SIG=CONC,故障消除。案例8:某个新建基站传输状态正常,硬件也不存在问题,但基站开不起来基站数据定义看起来不存在问题,其它检查也做了很多,但基站仍然不能开起来。重点检查基站DIP所连接的SNT的DEVICE数据定义,会发现RBLT的状态不对,为MBL闭掉的状态,试图解闭,可能还会发现未完全定义,再用EXDAI、EXDUI指令进行补充定义,解闭此SNT所带的RBLT,再重新LOAD基站数据后问题解决。对新建基站开不起来的情况,还有BSC侧MO=RXOCF的TEI值与基站OMT软件定义的不一致,导致基站无法同BSC建立联系。此种情况较多的出现在级联基站上,重新
14、定义,使基站的TEI值同BSC侧定义的TEI值一致便可解决问题。案例9:盲校基站存在瞬断现象,导致信道完好率虽然很接近但达不到100%,同时基站传输设备也出现传输瞬断的现象。检查基站硬件设备,及传输设备均未发现异常,更换DXU也无法解决问题。在基站上进行故障处理时,发现老式的爱立信开关电源存在模块损坏的情况,但仍能正常工作。经过长时间现场观察,发现交流电压不稳定,忽高忽低,当电压过高时,开关电源的过压保护器便跳脱保护,爱立信开关电源所有的模块处在过压保护的状态,同时传输设备瞬间复位,导致基站瞬断。此时就发现了交流电压过高可能是导致盲校基站瞬断的原因。经过分析,老式的爱立信开关电源对交流电电压波
15、动范围的适应性较差,当电压过高超出其限定值时,开关电源的所有模块出现瞬间的保护而导致其直流输出电压异常,从而导致传输设备因直流供电不能满足要求而瞬间复位,导致爱立信基站瞬间退服。将老式的爱立信开关电源更换为能适应宽范围交流电压波动的新式开关电源,问题解决,盲校基站再也未出现瞬断的现象。这样的情况也存在于其它部分型号的、对交流电压波动适应性差的老式开关电源上。案例10:柳行头基站为九期新建全向2载频基站,传输环路状态正常,不存在滑码、误码等传输质量差的情况,基站硬件状态正常,不存在任何告警,但将传输头子接到DXU的G.703-1接口后,BSC侧传输状态显示WO正常状态,但是DXU黑灯,所有的指示
16、灯均不亮。从BSC侧观察是CF无法Load成功,导致此基站开不起来。首先全面检查基站硬件、传输设备、传输电缆等均没有发现问题,检查柳行头基站数据、小区数据定义也没有发现问题,更换DXU也不能解决问题。从BSC的ETC传输接口处将柳行头基站的传输同另外一个相同配置且正在运行的松峰基站传输互换,不必改动任何数据,也就是说互相用对方基站的数据来开通。柳行头基站的数据在松峰基站上运行正常,而松峰基站的数据却无法在柳行头基站上运行,这就可以说明柳行头基站的数据不存在错误、掉死等异常情况,而从BSC到柳行头基站的传输通路上存在问题,也可能是基站硬件存在问题(这已排除)。这样重点怀疑从BSC到柳行头基站的传
17、输通路上存在问题,需要仔细检查,传输维护人员从BSC往基站方向一段一段进行检查,果然发现在北园传输机房处柳行头基站的传输跳线存在问题,120欧姆4根信号传输线中的一根与配线端子处在似接触非接触的状态,重新卡接后,柳行头基站CF软件load成功,基站顺利开通,问题解决。需要注意的是,基站电路环路时是通的,并不能代表基站电路完全不存在问题,因为还存在类似上述传输信号线接触不好、远端告警等一些特殊的传输故障现象。案例11:邮政局基站C小区扩容到主、副架共12个载频,但是最多只能开起来10个载频,总有2个载频无论如何也开不起来,并且这2个开不起来的载频位置不固定,状态表现为仅Tx not enable
18、灯亮。基站不存在告警。更换相应的载频无效。仔细观察开不起来的2个载频的故障现象,发现总是某一个CU上的2个载频同时出现开不起来的现象,虽然这个CU也不是固定的。将12个载频中的某两个位于同一个CU上的载频TRX闭掉,其它10个载频均能正常工作。根据以上现象,考虑到爱立信基站载频相互间发射部分TX和接收部分RX存在“借用现象”,即载频A的RX(可能载频A的TX存在问题)和载频B的TX可以组成一个完整的正常工作的“载频”,而载频A的状态可能为正常运行状态,而载频B的状态为仅Tx not enable灯亮。进一步从BSC上观察邮政局基站C小区各MO的工作状态,发现最后2个载频的TX-11&-12工作
19、状态开始时总是NOOP,过一段时间之后状态变为FAIL,但是考虑到最后2个载频的TX发射部分可以借用另外2个载频的TX发射部分,即存在TX的“借用现象”,因此状态仍有可能是正常运行的。导致TX状态为FAIL的原因有发射通路上的CDU存在问题,连接的天线驻波比过大,TX定义的连接小区错误,TRU的发射部分存在故障等原因。经过排查,重点怀疑是最后2个载频,即TRX-11&-12对应连接的CU存在问题,虽然此CU的运行状态正常,无故障灯指示。更换此CU后,邮政局C小区的12个载频全部开起来,问题解决。这种类型的故障处理,不要被基站各硬件的运行状态显示所迷惑,可能状态是正常的,但是也有可能存在问题,就
20、像上面所讲的CU的故障现象。案例12:TX无法正常工作,基站告警为CDU output power limits exceeds九期工程中,在开通西梁王基站(S2,2,2)时,发现虽然基站本测过程中,各MO 状态正常,均无告警,但是在开站时,当TX打开后, B小区CDU的Fault 红灯亮,,小区不能工作。我们通过OMT查寻告警,监测到SO CF 2A:9 :CDU output power limits exceeds。首先我们怀疑天馈系统有问题,用驻波比测试仪测得DTF值1.08,SWR值1.19,均为正常值。随后更换了CDU及TRU后故障仍未排除。最后我们根据TX的原理,输出功率由前向及
21、反向功率的比较得出的(Reference RBS2202) ,于是检查对应的Pref,Pfwd馈线,发现标签贴反,导致反向功率总大于前向功率,更改后故障消除。案例13:基站存在SO CF 2A: Timing bus fault告警,TRU无法工作。建工大厦基站(S6,6,6,)在扩为(S8,6,6)时,A小区扩容的副柜TRU状态不对,TRU的Fault在自检后长亮。此时B,C小区已正常。用B,C小区的机柜带A小区的副柜无问题,从而证明A小区的副柜本身无问题。通过OMT查寻告警,监测到SO CF 2A: Timing bus fault。更换C5 BUS线后故障仍未排除,于是判定故障点应在A小
22、区机柜本身之内。根据OMT读出告警,判断故障为机柜内 BUS问题,更换后状态正常,A小区正常工作。案例14:PSU的排障方法下面是满配置的PSU与ECU的光纤连接示意图:在基站出现同PSU相关的告警后,到基站上观察PSU的状态,可能有如下两种情况:第一种是PSU亮红灯或不亮灯,第二种是PSU面板状态正常但可能存在故障。针对第一种情况,首先检查PSU的-48V直流(PSU -48)或230交流(PSU 230)输入是否正常,可能存在输入开关跳脱或熔丝熔断的情况,如果排除上述情况,那么很可能是亮红灯或不亮灯的PSU存在故障,进行更换确认。对更换后的新PSU,应该先加-48V直流或230交流输入(下
23、面的接头),再连接直流输出接头(上面的接头),否则容易导致新加的PSU因为直流电流倒灌的原因而再次损坏。针对第二种情况,使用逐个排除的方法来找出存在故障但面板显示正常的PSU。满配置的PSU数量一共是4个,与ECU通过光纤串联在一起,形成一个环路。首先甩开左边第1个PSU,将剩下的3个PSU同ECU通过光纤串形连接,再观察基站的PSU相关告警是否消除,如果消除,则说明左边第1个PSU存在故障,进行更换;如果故障仍未消除,可将左边第2个PSU单独甩开,将剩下的3个PSU同ECU通过光纤串形连接,需注意的是从左边第1个PSU直接连接到第3个PSU的光纤需要换成长一点的光纤,再观察基站的PSU相关告
24、警是否消除,以此类推,逐个排查PSU。除了上述方法,类似的,还可采用每个PSU单独同ECU串形连接,再观察基站告警是否消除的方法,逐一进行排查。还有一点需要说明的是,基站对PSU的识别并不是完全根据PSU的安装位置,例如最左边的PSU被识别为PSU-0,向右依次为PSU-1、PSU-2、PSU-3,实际上并不是这样的。基站识别PSU是通过光纤环路来识别的,不在这个环上的PSU将不被识别,同时针对这个不在环上的PSU基站也不会产生告警。光纤环路连接最左边的PSU被识别为PSU-0,然后依据光纤环路上的连接,向右依次识别为PSU-1、PSU-2等,例如PSU-0,它的实际安装位置可能是从最左边数第3个PSU。有一个故障现象是某个PSU的架顶-48V输入接口因短路损坏严重,不能再使用,并且基站存在相应告警。消除告警的办法是在PSU与ECU的光纤环路中,甩开这个损坏严重的架顶-48V输入接口对应的PSU,再从IDB数据中删除多余的PSU(损坏的接口对应的)即可消除告警。