《最新NSN-BSS网元节日保障方案.doc》由会员分享,可在线阅读,更多相关《最新NSN-BSS网元节日保障方案.doc(35页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、Four short words sum up what has lifted most successful individuals above the crowd: a little bit more.-author-dateNSN-BSS网元节日保障方案3G Project Management Guide NSN BSS网元节日保障方案1.1 BSS部分预防性方案(保障前维护工作)1、 检查机架和机框电源电压,其电压波动应在规定的允许范围之内。2、 检查时钟同步系统,确保主备用同步系统能顺利切换并正常工作。3、 对各个单元进行诊断并对单元间的切换机制进行检查。4、 备份BSC和BTS软
2、件包到磁带或光盘上并妥善保存。5、 检查各计算机单元的负荷情况,并根据往年的统计数据进行单元负荷预测,最后根据预测结果对网元进行必要的调整以尽量避免在节日的话务高峰期间出现单元过负荷的情况。6、 检查A接口和无线接口上的信令链路及话务信道的配置情况,并根据往年的统计数据进行话务预测,并根据预测的结果进行必要的扩容。7、 均衡BCSU的负载分配,避免可能的BCSU过载情况的出现8、 根据RNP的分析建议,Split the LAC If the paging amount is more than 100,000 per hour, we suggest splitting the LAC.如果
3、每小时寻呼数超过100,000,我们建议splitting the LAC9、 Change the LAPD link from 16kbit/s to 32kbit/s in Hot-spot site.建议热点地区基站修改LAPD信令速率16kbit/s 增加为 32kbit/sWe suggest changing the TRXSIG link to 32kbit/s in the Hot-spot site if the BSC is BSC2i or BSC3i. Attention, if it is BSC2E, we dont suggest. Do not change
4、all BTSs inside BSC.10、 启用动态SDCCH和DR 的Feature将会在高话务时刻有所帮助11、 A interface check A接口检查:BSC的A 口信令负荷的检查(检查命令为ZOLT),信令链路是否为2的N次方以利于负载Check the A interface link is configurated as 2n. If not, we need create more links.If the signaling link load in A interface is over 0.2 Erl on one direction repeatedly, w
5、e suggest adding more link. It can be check with command:ZOLT:X&Y;12、 视情况是否需要应急通信设备1.2 BSC部分的监控措施1.2.1 检查BSC及基站的告警(建议每半小时查看一次), 主要包括以下内容: 及时处理各网元两星及两星以上的告警 对于两星以下的异常告警也必须予以高度重视,尤其是涉及重要单元的告警 对于频发告警应及时处理 根据近期现网的运行经验, 建议对下列告警予以特别关注:2757 CARTRIDGE NON-REDUNDANT POWER SUPPLY FAILURE 2755 CARTRIDGE CLOCK
6、FAILURE 2692 INCORRECT WORKING STATE - 应特别关注非ET单元1582 CONNECTION OR RELEASE ERROR 1071 PROCESSOR TIME SHORTAGE1044 ERROR IN SWITCH COMPARE TEST1045 ERROR BETWEEN MARKER TABLES AND SWITCH CONTROL MEMORY1663 HAND RESERVATION ERROR IN DATABASE MANAGER3019 NETWORK SERVICE ENTITY UNAVAILABLE3020 NETWORK
7、SERVICE VIRTUAL CONNECTION UNAVAILABLE命令列表包括: ZAHO; ZAHP;ZEOL;ZEOH;1.2.2 检查各单元及硬盘工作状态, 确保各单元工作正常(在机房现场准备好备件)命令列表包括: ZUSI;ZISI;1.2.3 检查信令链路及电路的工作状态及负荷状况: 单向链路负荷超过0.2Erl 时, 建议增加链路数量.命令列表包括: ZNET;ZNHI;ZNLI;ZOLT;ZRCI;ZCEL;1.2.4 检查基站工作状态:命令列表包括: ZEEI;ZEEL;ZDSB;ZDTI;1.2.5 检查GPRS业务状况: 重点关注GPRS休眠小区, PCU吊死以及
8、GB链路状态三个方面.命令列表包括: ZFUI;ZFXO;ZEEI;ZEEL;ZDDS:BCSU,;ZRS:30,50BE (syntax: ZRS:, BE)dpcualloc在进入SERVICE TERMINAL查看PCU数据时应特别注意, 任何无关的其它命令都不能执行!1.2.6 检查测量报告状态及传送状态:命令列表包括: ZIFI;ZIFO;1.2.7 在忙时应慎用的指令以下指令有可能大幅度增加系统负荷, 因此尽量规避在忙时执行以下指令:ZERO:BTS=;ZEAO:BTS=;ZEQO:BTS=;ZFXO:BCSU=:BTS;ZEEO:BCSU;ZDOI;1.3 出现话务拥塞时的应急解
9、决方案1.3.1 监控BSC的相关告警1)在高话务量时,观察记录BSC的相关告警,以下的告警容易出现。同时采取相应的措施:2720: TELECOM LINK OVERLOAD2133: SEND BUFFER OVERFLOW IN SIGNALLING TERMINAL1014: PROCESSOR LOAD RATE ALARM LIMIT EXCEEDED2993: BTS AND TC UNSYNCHRONIZATION CLEAR CALLS ON ABIS INTERFACE7745: CHANNEL FAILURE RATE ABOVE DEFINED THRESHOLD130
10、2: PAGING OVERLOAD0125: PCU PROCESSOR LOAD HIGH3164: PCU PROCESSOR OVERLOAD1071PROCESSOR TIME SHORTAGE2478 MOBILE ACCESS CLASSES ABNORMAL2770 PREPROCESSOR UNIT FAILURE 0026 SIGNALLING LINK LOAD OVER THRESHOLD 当发生BCSU自动倒换故障时,注意观察相关基站的CS&PS工作状态 当发现现网存在1583告警,应注意检查是否存在垃圾LAPD数据以及该BSC下基站的工作状态是否正常, 发现垃圾数据
11、应及时予以删除 3) 加强对重要站点的GPRS休眠小区监控,在对系统进行EDAP数据的修改前应先将GPRS功能闭锁, 修改完成后观察流量是否恢复. 同时在网管侧每隔一小时通过查看测量报告的相关数据进行休眠小区的监控, 做好两手准备. 4) 加强对重要站点所属的PCU的流量监控, 一旦发现PCU出现单向流量,零流量或异常流量故障时, 应立即采取措施, 进行手动BCSU切换, 并观察切换后PCU流量是否正常,且相应的GB链路状态是否正常, 如有GB链路闭锁现象发生,立即手动激活.1.3.2 A口电路占用情况的观察对A口电路占用情况的观察,可以通过亿阳的实时监测应用观察,也可以通过Traffica
12、系统观测:(MML命令:ZCEL:CGR=1&2;)1.3.3 对信令负荷的观测信令负荷不应超过0.2 Erl. MML命令:ZOLT:0&15;【故障现象】BSC上出现0026告警,统计报告显示信令链路的负荷超过每条0.2爱尔兰或每线话务量超过0.6爱尔兰。如果信令链路负荷超出了0.4Erl,此时应与MSC工程师协同解决。如果同时有2478告警出现,则可以判断是MSC出现了过载。【Fault Phenomena】Alarm 0026 appears in BSC, and the statistics report shows that each signaling link load ex
13、ceeds 0.2erl or average circuit traffic exceeds 0.6erl.【解决方案】增加A接口的信令链路或电路以满足负荷门限的要求。【Solutions Plan】Increase amount of A-if signaling link or amount of circuits to fullfil the load threshold.1.3.4 对BCSU计算机单元负载进行观测 BCSU单元平均负荷不能超过NOKIA定义严重告警门限(60%),并且当BCSU单元的平均荷超过定义的门限值时会出发2720告警和1014和1071告警,MML命令:ZD
14、OI:BCSU; 注意在高话务时千万不要用TOPTEN的扩展菜单看进程负荷: 当出现针对BCSU的2720告警出现时,意味着LAPD上行方向出现了过载,这时可以通过修改BTS级别的参数RET(从缺省值4改为2或1)/ZEQM和BMA(从缺省值1改为2或4)/ZEQM来减轻LAPD上行负荷。如果出现2133告警,在排除了AS7插件板的硬件故障后,意味着LAPD下行方向出现了过载,比较有效的手段是与MSC工程师协商以减少寻呼的发送次数。如果出现1302(S11.5)告警,则说明BCSU出现了过载,可以通过减少BTS级别的参数AG(最小改为1)/ZEQJ和MFR(最小改为2)/ZEQJ来缓解寻呼的压
15、力,此时应立即与MSC工程师联系以减少寻呼的发送次数。 当0125(S11.5)或3164告警出现时,说明PCU出现了过载,此时为避免可能出现的2770告警导致BCSU的自动切换,可以使用ZUST指令为所有BCSU设置RBAN信息以阻止其切换 疏导出现过载情况BCSU控制的话务,如均衡过载BCSU控制的TRX至其它低负载的BCSU, 需将TRX的LAPD LINK删除并重新由低负载的BCSU控制。(需断开基站) 在MSC侧改变寻呼策略,减少A口PAGING消息总量,降低BCSU负荷。1.3.5 对热点基站的话务进行观察,出现拥塞情况采取相应措施: 修改MS RACH RETRANSMISSIO
16、N(RET) 参数 from 4 to 1 ZEQM:BTS=XX:RET=1; 修改 BTS MEASURE AVG(BMA) 参数from 1 to 4 (if Abis UL overload) ZEQM:BTS=XX:BMA=4; 修改Number of slots spread trans(SLO) From 10 to 12 ZEQM:BTS=XX:SLO=12;(以上三种方法需要在锁站的状态下修改,实践证明在高话务情况下闭锁基站不是个好选择,最好在事先对热点基站设定好相应的参数) 修改Power control interval参数 from 2s to 4s. ZEUG:BTS
17、=XX:INT=4; 修改基站的最低接入电平RXP. ZEUG:BTS=XX:RXP=XX; BSC处理能力过载或Abis接口信令拥塞 缩短T3101的时长,以尽快释放无线资源。T3101的缺省值为3秒,可减少至2秒。ZEGT:T3101:,2; 延长T3122的时长,以使发生拥塞的手机用户在这段时间内不要试图登录网络造成更大的拥塞。缺省值为6秒,可增至10秒甚至20秒。ZEGT:T3122:,10;【故障现象】手机用户难以拨通电话,统计报告显示有大量的立即指配失败(T3101时限超时)。在BSC上用ZEEL指令查看时可发现SDCCH占用数量接近或超过TCH的占用数量。在故障期间BSC上可能会
18、出现大量的2993告警和77XX告警。【Fault Phenomena】User experience difficulities to make calls, and the statistics report shows that there are a lot of Immediate Assigment failure(T3101 timer expired). Use ZEEL commandto to find that the total number of busy SDCCH is close to or bigger than that of TCH. During the
19、 fault period, a lot of alarms 2993 and 77xx may appear.【解决方案】用ZEGT指令将T3101(缺省值为3秒,实际值可能为5秒)的值改为2秒,以尽快释放被无效占用的SDCCH。用ZEGT指令将T3122(缺省值为6秒)的值改为10秒甚至20秒,以减缓用户的请求次数。在相关的MSC上对MT-SMS进行紧急限制(具体方案待定)。【Solutions Plan】Use ZEGT command to change T3101(default 3s, used value may be 5s) value to 3 second to relea
20、se invalid occupied SDCCH. Use ZEGT command to change T3122(default 6s) value to 10 seconds to slow down user attempt. Also make emergent restricts to MT-SMS in the relevant MSC(detail scheme will be decided later). 当阻塞进一步加深时,可以通过修改BTS级别的参数ACC来暂停部分用户的业务,还可以通过修改BTS级别的参数BAR来暂停部分小区的业务,甚至直接关闭部分基站。 采取逐步降
21、低基站功率的办法缩小话务量的吸收. ZEUG:BTS=XX:PMAX=YY;效果最为明显。 在高话务时千万不要用TOPTEN的扩展菜单看进程负荷。如果保障期间短信量较大,可采取下列方式限话:无线方面BSC侧的保障建议:1、增加SDCCH信道2、在BSC侧降低基站的TX功率,降低话务的吸收 例如:ZEUG:BTS=248:PMAX=24;以上需要RNP部门提供可能出现短信拥塞的基站列表,规划出需要增加SDCCH的TRX号,并提供基站发射功率需要修改的数值,以便BSC工程师做调整1.4 BTS 部分前期维护工作: 主要告警的排查 检查备用供电电源以及备用电池,确保其能正常工作。 明确每个基站电闸的
22、确切位置。一旦出现市电告警,才能在做好发电准备的同时,第一时间排除电闸被人误拉或跳闸的可能性,提高效率。 检查主时钟频率,其偏差应在规定容许的范围之内。 用SiteMaster检查天馈线。如发现驻波比超高,应找出错误并且及时纠正。 扩容上去的载频要做TEST,确保性能良好,以防在一段时间后载频退出工作而引起扇区的重起。 尽可能多准备备件(RTGA,TSGB,TSDB,TRXA),尤其是RTGA。 提前联系好业主,以便于在基站出现告警的情况下,能尽快的进入机房。 确认站点空调运行良好。由于节日期间话务量将大幅增加,导致设备散热量很大,如果空调出现故障,几个小时就可能导致RTGA被烧坏。 保障应急方案: 当BTS发生话务拥塞时,根据网络要求对BTS进行紧急扩容。 当BTS发生硬件故障时,更换BTS相关硬件。-