上海通信段MSC设备应急预案.pdf

上传人:ylj18****70940 文档编号:82138109 上传时间:2023-03-24 格式:PDF 页数:31 大小:1.65MB
返回 下载 相关 举报
上海通信段MSC设备应急预案.pdf_第1页
第1页 / 共31页
上海通信段MSC设备应急预案.pdf_第2页
第2页 / 共31页
点击查看更多>>
资源描述

《上海通信段MSC设备应急预案.pdf》由会员分享,可在线阅读,更多相关《上海通信段MSC设备应急预案.pdf(31页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、 上海通信段 MSC 设备应急预案 Newly compiled on November 23,2020 编 号:上 铁 电 专-共 用-0 4-0 0 1-2 0 1 5 数字移动通信系统 MSC 设备应急预案 上海通信段上海高铁通信车间 2016 年 2 月 一、编制依据 1.上海通信段应急处置管理实施细则(上通信调2015230号);2.上海铁路局关于进一步规范路局应急处置指挥体系建设的通知(上铁运2014283 号);3.上海通信段铁路通信障碍(故障)管理实施细则(上通信调发201389 号)二、系统整体介绍 上海 GSM-R 机房 MSC 基于西门子 EWSD 平台。所有寄存器功能,

2、都是由软件来实现的。在硬件设计方面,许多重要部件都设置了冗余备份,主要体现在 0 侧与 1 侧互为备份。目前 MSC 网络应用情况:与北京核心网、武汉核心网的 MSC/VLR、HLRi、SCP 相连,与虹桥 BSC、京沪高 BSC、南京 BSC、温州 BSC、阜阳BSC、合肥 BSC、杭州 BSC 各局向、FAS 等相连,实现了上海局下所有 GSM-R 客专线的 GSM-R 核心交换、网内移动号码的鉴权、铁路专用的位置寻址、功能寻址、调度台与 GSM-R 移动终端的通信等功能。三、应急预案内容 1.故障等级(一、二、三级)1)一级:设备宕机、与一个或多个 TMSC 局向中断、与某 STP 的信

3、令能力中断、突发话务量造成上海 MSC 负荷过高的设备过载控制、智能业务中断、与专网(PSTN)的互联互通故障、与 FAS 系统局向全部中断、HLRi 系统故障、与 BSC 系统局向全部中断、与 RBC 机房互联全部中断、与北京武汉互联电路全部中断。2)二级:MSC 个别进程或数据吊死、对某局向中继部分中断。3)三级:单板故障(影响业务)2.关键项:汇报、登销记 1)当虹桥 GSM-R 工区发现局管内 GSM-R 系统 MSC 设备发生障碍(故障)时,应在五分钟之内汇报段调度、车间主任、网调工区,并通知相关设备维护车间网调工区。2)车间主任在接到汇报后,立即组织人员赶赴虹桥 GSM-R 工区,

4、负责组织指挥处理、信息汇报、障碍(故障)分析等。3)虹桥 GSM-R 工区负责障碍(故障)的指挥处理、过程信息汇报、处理报告的撰写等。4)网调工区根据虹桥 GSM-R 工区的处理要求,组织做好车间管内相关配合工作。3.针对不同设备及故障等级编制处理措施 1)上海 MSC 宕机的应急技术预案(一级)(1)启动前提 交换设备瘫痪、全部能力丧失时启动 MSC 宕机应急技术预案。启动前提可归结为以下三种情况:交换机系统掉电;交换机 CP 侧瘫痪;交换机 MP 侧瘫痪;(2)制定方案的原则 现场操作维护人员一定要马上通知诺西公司相关技术支持人员,并且清楚地描述宕机状态的发生时间以及问题的具体详细情况,不

5、能擅自单独处理。在机房备有紧急故障处理的 Emergency 手册,以备现场处理参照。日常维护中严格执行计表中系统备份制度,备份带务必做好详细标签。系统在重大操作前都必须做好系统备份带。下表是各恢复等级的描述:恢复 等级 重启影响 由MML启动 由SW启动 正在建立的呼叫丢失与否 已经建立的呼叫丢失与否 预计恢复时间 NSTART0 所有与呼叫处理不相关的进程的重新启动 X X NSTART1 所有进程重新启动 X X X 50s NSTART2 所有进程重新启动,重新装载程序代码和所有半永久数据 X X X 50s NSTART3 所有进程重新启动,重新装载程序代码和所有半永久数据以及特定的

6、瞬态数据 X X X 60s 恢复 等级 重启影响 由MML启动 由SW启动 正在建立的呼叫丢失与否 已经建立的呼叫丢失与否 预计恢复时间 ISTART1 初始启动 SSP:不对外围SW(LTG/DLU)做无条件重新装载 X X X X 120S ISTART1B 呼叫处理基本模式 X X X 120S ISTART2 初始启动 SSP;无条件重新装 载外围数据至所有应处于工作状态的 LTG X X X X 6M ISTART2R(在修改 LTG软件后使用)带重新装载的 SSP初始启动;仅通过人工操作,无条件装载不处于 MBL 或PLA 的 LTG X 不相关 不相关.15M ISTART2F

7、(在安装 APS后使用)强制初始启动SSP,仅通过人工操作,装载处于MBL 状态外 所有已安装的 LTG X 不相关 不相关.15M ISTART2G 初始启动 SSP,倒回至旧的 APS GEN;无条件重新装载所有应处于工作状态的 LYG/DLU的外围程序 代码和数据 X X X X 15M ISTART1/2 的后处理恢复尝试重新装载并激活所有处于 UNA 的LTG/DLU。NSTART1B 和 ISTART1B 不用于 D900/1800 移动业务交换中心 MSC。(3)应急措施 抢修组确认预案启动前提成立,参照应急通信故障的报告和通报流程制度启动应急预案。宕机应急技术预案启动后,抢修组

8、应马上联系诺西相关技术支持。在诺西人员无法马上赶到现场的情况下,现场维护人员应在诺西技术支持的指导下,严格参照 Emergency 手册中相应的紧急流程进行分析处理。a.交换机掉电时,影响所有 GSM-R 业务,系统需重新启机,启机最长用时 40 分钟。D900 交换机在断电后再通电会自动选择 GEN 重新启动至 MANUAL 状态,设备自动重启之后如果有不正常的状态,需尽快的将交换机恢复至 ACTGEN并保证硬件设备正常,以下为具体操作流程:若设备自动重启无法正常启动,需要用人工进行重启,详见 CP 侧瘫痪、MP 侧瘫痪应急预案。b.交换机 CP 侧启机,影响所有 GSM-R 业务,需立即对

9、 CP 侧进行启机:准备工作:将 IOP-UNI 后背板的 03C295P1 或 04C295P1 连出线为串口线连接到电脑终端 COM1 口;将 CP 侧 1 侧的 BAP(010101 柜 07 框 257)关电,用于必要时的备用。在电脑终端打开 BMML 操作框(必须有 BMML 软件)。硬盘状态正常,在正常(MANU)模式下重启:需人工重启交换机,重新 LOAD LTG,在 CP 侧执行指令RECOVSYSTEM:LEVEL=ISTART2F;然后做常规检查。在 CP 侧执行DISPGEN;检查当前 GEN 是否重启前在使用的 ACTGEN,若是 GEN 列表里第一行的 GEN,则为

10、ACTGEN,否则为 BACKUP/GOLDEN GEN 检查重启时是否进行了 ISTART2G,可通过 CP 侧指令DISPALARM;看种类为ISTART 的告警的详细信息或交换机重启时的 LOG来得知。系统已倒回原来的备份GEN,需立即通知TAC,现场应尝试人工重启系统恢复至ACTGEN,在CP侧执行令RECOVSYSTEM:LEVEL=ISTART2G,GEN=“ACT GEN”;后续检查必须在TAC指导下进行。系统工作在正常的 ACTGEN 下,由于已做过 ISTART2G,LTG应该极少有 SEZ的,详细检查应通知 TAC完成,此文档不涉及,现场需做常规检查。系统工作在正常的 AC

11、TGEN 下,且大部分 LTG 工作正常,可通过人工指令激活不正常的 LTG,流程见附一。然后做常规检查。Y N N Y Y N 至交换机的连接应已建立,在CP 侧执行:STATLTG:LTG=X-X;检查是否有很多 LTG 在 SEZ状态.按 0 侧 CMY 的 boot 键,在 BMML 中输入命令“FORMAT;”出现显示(如果无显示,需要重新按 boot 键)-“;”-“MANU”-“IOC-0”(如果启机用 1 侧,则用 IOC-1)-选择一个 GEN 的名字(一般用前期所用的 GEN,本次用的为 ODAGEN-FORCED-需要一段时间大约 40 分钟,之后查 STATSSP 确认

12、启机是否完成。硬盘状态不正常,使用最近备份的光盘启机,在 UTI 模式下重启:按 0 侧 CMY 的 boot 键,在 BMML 中输入命令“FORMAT;”出现显示(如果无显示,需要重新按 boot 键)-“;”-“UTI”-“MOD”-“010C23”(为 MOD0 启机)-“”输入命令:INITMD:DEVOUT=010C01(如为 MDD1 则输入 030C01);初始化硬盘;LABELMD:DEVOUT=010C23;做成系统盘;TRANSFILE:DEVIN=010C23,DEVOUT=010C01(如为 MDD1 则输入 030C01);FILECAT=*,OLDGEN=*,NE

13、WGEN=*;将光盘下所有文件传送到硬盘下。使用硬盘在 MANU 模式下再启机。启机之后,使用 Switch Commander 进行查看 DISPGENCPMP,确认GCS 一致。查看相应的 CP、MP 侧状态。确认一切正常,并修改时间(ENTRTIME)。c.交换机 MP 侧瘫痪,影响所有 GSM-R 业务,需立即对 MP 侧进行启机(硬盘、光盘启机均适用):准备工作:准备一台笔记本电脑,一条 9 针串口线,到设备前,将串口线连到 0侧 MP:OAM(010102 柜 09 框 251 槽);将 1 侧 MP:OAM(010102 柜 09 框 271 槽)拔出;将电脑服务中的 BCT C

14、OM 口 release 掉,打开超级终端 操作步骤:按 0 侧 MP:OAM(010102 柜 09 框 251 槽)RES 键,超级终端出命令,CTRL-X 进入选项(1,2,9)-进入 1 确定 IP 地址、ASN 等无误,确认使用 MDD(MOD);-进入 2 选择 GEN-进入 9 选择 reboot。启机大约20 分钟。启机之后,使用 Switch Com 进行查看 DISPGENCPMP,确认 GCS 一致。查看相应的 CP、MP 侧状态。确认一切正常,并修改时间(ENTRTIME)。(4)全业务验证 宕机恢复后必须对全业务进行验证,包括开关机、通话(MTC/MIC/MOC/MM

15、C)、组呼/广播、短信、短号码、列控业务(RBC)、FOLLOW ME 等等。(1)启动前提:SGSN 宕机,主备的功能单元模块均不能正常工作,同时已有平时的SGSN 数据备份带。(2)应急措施:日常维护中应该严格执行计表中的系统备份制度,做好备份带及详细标签。系统在重大操作前都必须做好备份带。宕机预案启动后,机房操作维护人员应该马上联系诺西相关技术支持,在诺西技术人员无法马上赶到现场情况下,现场维护人员应该严格按照诺西厂家提供的相应紧急故障处 理流程进行分析处理。紧急情况下可能需要对设备进行重启、切换操作,在进行类似操作前,应运行命令收集信息,便于故障的跟踪处理。(3)实施步骤:SGSN:登

16、录进 SGSN 的管理界面,按照下列步骤进行操作。a.系统重启:确认系统有可用的备包;WQO:CR;同步数据库文件;DBC:GPDATA,0;DBC:OEDATA,0;DBC:EQUIPM,0;检查数据库的一致性 DBS:GPDATA,0 DBS:OEDATA,0;DBS:EQUIPM,0;DBD:OMU;确认磁盘同步任务已经全部完成 DUQ;关闭并上传所有话单 GHA;重启系统:USS:SYM:C=DSK;b.系统还原:从光盘复制备包到硬盘:IWL:,OMU:WSB,NODEF:FB061214,FFF0,XY:;IWY:S:UNIT=OMU,PATH=/SG04-061214,DRIVE=

17、FDU-N0,;IWY:D:UNIT=OMU,PATH=/FB061214,DRIVE=WDU-SB,;IBC:,%,DIR:;IWX:,OMU:WS,NODEF:FB061214,:%,%,;WQC:NAME=FB061214,DIRE=FB061214,:CW=ALL,:;当 default BU 包出错时用 FB 包还原:将 FB 包状态改为 default WSD:NAME=FB010712 修改状态,WSR;WKS:MODE,NAME=FALLBACK1,DIRE=FALLBACK1,MODE=FULL;WQD:NAME=BENSON1:DIRE;必要时确认包的内容 WQB:NAME

18、=FALLBACK1:FORM=FAILED;c.收集软件故障数据:ZDDS:,;启单元:USU:PAPU,0;2)与一个或多个 TMSC 局向中断(一级)(1)启动前提 上海 MSC 与一个或多个 TMSC 局向中断,仍有可正常通信的 TMSC 局向。(2)预案原则 按照局数据设置原则应当增加到各个局向的备份话务路由。到归属汇接区的 MSC 备选话务路由是本汇接区的 TMSC。到非归属汇接区的 MSC 的备选话务路由是第二汇接区的 TMSC。用户拨号方式不变;以保证接通为主,主叫号码规范、计费等仅尽量兼顾,在紧急情况下不做严格要求。目前上海 MSC 只有与武汉 TMSC 和北京 TMSC 相

19、连,根据实际情况武汉 TMSC 是归属汇接区的 TMSC,北京 TMSC 是上海的第二汇接区核心节点。预案的执行与恢复都必须进行拨测确认。(3)应急措施 抢修组确认预案启动前提成立,参照应急通信故障的报告和通报流程制度启动应急预案。抢修组根据实际情况请求与中断 MSC 可正常通信的 TMSC 执行应急预案疏通话务,当疏通 TMSC 放通数据后,抢修组在上海 MSC 执行操作定义故障 TMSC 的号段指向疏通 TMSC 疏通话务。当故障恢复时,需要将数据恢复原状。a.倒代方案示意(以到武汉 TMSC 话务通道阻断为例)b.技术台账 MSC 局名 归属号段 武汉 北京 南昌 济南 c.操作命令行

20、倒代命令(执行完后进行拨测确认):CRROUTE:DEST=WHMSC,TGNO=BJMSC,ROUTE=2;由于现网与北京 MSC 无话路,但已经创建并保留路由 ROUTE 和中继群TGRP 数据,如果需创话路数据,可使用以下命令创建:ENTRC7TGREL、CRC7USER、CRTRUNK 当抢修组确认修复好中断 MSC 的通信故障后,抢修组组长汇报实时情况于领导小组,请求执行恢复,得到领导小组同意后开始执行倒代恢复。恢复命令(执行完后进行拨测确认):CANROUTE:DEST=WHMSC,ROUTE=2;归属汇接区 第二汇接区 武汉 TMSC 上海 MSC 上海 MSC武汉 TMSC 方

21、向的业务倒代示意图 北京 TMSC DISPROUTE::DEST=WHMSC;(确认已恢复路由中继群指向武汉),删除到北京的话路数据。3)与某 STP 的信令能力中断(一级)(1)启动前提 上海 MSC 与某 STP 信令能力中断,而到其他 STP 之间通信正常。(2)预案原则 可查询在 MTP 层是否有备份路由,按照局数据设置原则应当增加到各个局向的备份信令路由。到 LSTP 的备选信令路由是本信令区的另一个LSTP。到 HSTP 的备选信令路由是另一个 HSTP。目前上海 MSC 只有与武汉、北京 HSTP 相连,并已根据实际情况定义信令路由,当到其中之一的 HSTP方向信令路由全阻时,

22、MSC 会自动将信令全部转移到另一个 HSTP 上疏通。预案的执行与恢复都必须进行全业务验证,包括开关机、通话(MTC/MIC/MOC/MMC)、组呼/广播、短信、短号码、列控业务(RBC)、FOLLOW ME 等等。(3)应急措施 抢修组确认预案启动前提成立,参照应急通信故障的报告和通报流程制度启动应急预案。a 倒代方案示意 b.技术台帐 HSTP 名 信令点 武汉 42-255-22 北京 42-255-21 c.操作命令行 倒代命令(执行完后进行拨测确认):MODSIGDP:NETID=4,DPC=42-255-22,Admin state=LOCKED;当抢修组确认修复好中断 STP

23、的通信故障后,抢修组组长汇报实时情况于领导小组,请求执行恢复,得到领导小组同意后开始执行倒代恢复。恢复命令(执行完后进行拨测确认):MODSIGDP:NETID=4,DPC=42-255-22,Admin state=UNLOCKED;注:以上命令是在武汉 HSTP 无法处理信令但信令点未失效时用。4)突发话务量造成上海 MSC 负荷过高的设备过载控制(一级)(1)启动前提 备选信令路由 武汉 HSTP 上海 MSC 上海 MSC武汉 HSTP 方向的业务倒代示意图 北京 HSTP 首选信令路由 由于突发话务量等原因导致某些方向的呼叫难以接续;从而引起 CPU负荷过高并有可能引起 MSC 重启

24、。(2)预案原则 以保证 MSC 通信安全为主,并最大限度保证优先级高的用户通信。当MSC 恢复正常后,条件成熟时,可以逐渐地解闭先前关闭的设备。(3)应急措施 抢修组确认预案启动前提成立,参照应急通信故障的报告和通报流程制度启动应急预案。并按照实际情况采取以下相应措施降低 MSC 负荷。(注:以下措施执行必须获得领导组的同意)a.关闭鉴权 当 CP 负荷过高时,可以首先考虑在 MSC 完全关闭鉴权以大幅度降低鉴权的次数,降低 A 接口的负荷,也可以降低 BSC 的负荷及 SDCCH 的占用时长,减少 SDCCH 的拥塞,同时也会降低 MSC 到 HLR 的信令负荷。应急命令:MODSERVO

25、PT:FEAT=AUTHENT,STAT=BLK;恢复命令:MODSERVOPT:FEAT=AUTHENT,STAT=ACT;注意:关闭鉴权可以降低 CP 负荷,但在完全关闭鉴权后,某些非法SIM 卡就可能呼叫成功,所以应注意在话务高峰过去后及时恢复数据。还需要注意的是,关闭鉴权后,是使用 IMSI 寻呼,CP 负荷是降低了,但是基站的寻呼负荷可能会增加。建议按实际情况操作。b.闭塞部分电路 对于因某条或某几条路由负荷过高引起交换机负荷剧增,可考虑实际情况闭塞路由或闭塞部分电路以保证交换机的安全和其它路由话务不受影响。应急命令:ENTRTGDAT:TGNOWHMSC,CIC=2-1,BLK=A

26、dmin;恢复命令:CANTGDAT:TGNOWHMSC,CIC=2-1,BLK=Admin;c.考虑限制某种业务类型 比如限制用户收发短信,通过在 MSC 作限制手段,限制用户接收短信。应急命令:MODMSERVOPT:TSERV=TS21,STAT=BLK;(收信息)MODMSERVOPT:TSERV=TS22,STAT=BLK;(发信息)恢复命令:MODMSERVOPT:TSERV=TS21,STAT=ACT;(收信息)MODMSERVOPT:TSERV=TS22,STAT=ACT;(发信息)d.停止话务统计 通过停止收集话务统计,可以相应地降低 CP 负荷。应急命令:DISPJOB;(

27、查找话务统计任务号,例:80)STOPJOB:JN=80;恢复命令:CONTJOB:JN=80;注释:虽然可降低负荷,但是缺乏分析系统在超负荷时运行状态的信息,影响到以后对故障的分析处理。5)智能业务中断(一级)(1)启动前提 与北京和武汉 SCP 局向全部中断业务,影响位置寻址及功能寻址。(2)预案原则 为保证通信,用户放弃原有智能业务的拨号方式,直接拨打短号码、功能号、机车所对应的 MSISDN 号。故障排除后,恢复原有拨打方式。(3)应急措施 抢修组确认预案启动前提成立,参照应急通信故障的报告和通报流程制度启动应急预案。抢修组立即通知温福和甬台温及武广线调度员启动备用应急通信,将短号码及

28、功能号对应的 MSISDN 通知列车调度员,列车调度员把所对应的MSISDN 号通知火车司机。短号码对应 MSISDN 号码表:温福和甬台温及武广线短号码对应的MSISDN 号以开通业务为准。功能号对应 MSISDN 号码表:温福和甬台温及武广线机车对应的MSISDN 号以开通业务为准。当抢修组通过对智能网全业务进行验证,包括短号码、功能号、FOLLOW ME 等等确认已修复好智能业务通信后,抢修组组长汇报实时情况于领导小组,请求执行恢复,得到领导小组同意后开始执行倒代恢复。抢修 组立即通知温福和甬台温及武广线调度员故障已解决,停止备用应急通信。6)与专网(PSTN)的互联互通故障(一级)(1

29、)启动前提 上海 MSC 与上海专网局向中断,有可正常通信的 MSC 局向,且该局向与专网(PSTN)有连接。(2)预案原则 用户拨号方式不变;以保证接通为主,主叫号码规范、计费等仅尽量兼顾,在紧急情况下不做严格要求。目前上海 MSC 只有与武汉 TMSC 和北京TMSC 相连,武汉、北京 MSC 都有与 PSTN 相连。预案的执行与恢复都必须进行拨测确认。(3)应急措施 抢修组确认预案启动前提成立,参照应急通信故障的报告和通报流程制度启动应急预案。抢修组根据实际情况请求与武汉/北京 MSC 执行应急预案疏通话务,当疏通 MSC 放通数据后,抢修组在上海 MSC 执行操作定义 PSTN 号段指

30、向疏通 MSC 疏通话务。当故障恢复时,需要将数据恢复原状。a.倒代方案示意(以武汉 MSC 疏通话务为例)b.操作命令行 倒代命令(执行后进行拨测确认):DISPCPT:CPT=901;(结果显示 DEST=PSTN)DISPROUTE:DEST=WHMSC;(结果显示中继群指向 WHMSC)MODCPT:CPT=901,DEST=WHMSC;当抢修组确认修复好中断 STP 的通信故障后,抢修组组长汇报实时情况于领导小组,请求执行恢复,得到领导小组同意后开始执行倒代恢复。恢复命令(执行后进行拨测确认):MODCPT:CPT=901,DEST=PSTN;DISPCPT:CPT=901;(确认已

31、恢复 DEST=PSTN)7)与 FAS 系统局向全部中断(一级)(1)启动前提 上海 MSC 与上海/南昌/上海 FAS 系统全部中断,影响上海/温福/甬台温调度台与 GSM-R 移动终端通信,上海 MSC 与专网(PSTN)通信正常。(2)预案原则 901XXXXX 专网(PSTN)上海 MSC 上海 MSCPSTN 的业务倒代示意图 武汉 TMSC 901XXXXX 901XXXXX 为保证通信,临时启用调度台所在地的专网电话号码行驶调度功能。故障排除后,恢复原拨打方式。(3)应急措施 抢修组确认预案启动前提成立,参照应急通信故障的报告和通报流程制度启动应急预案。倒代方案示意(以到上海

32、FAS 系统全部中断为例)8)HLRi 系统故障(一级)(1)启动前提 HLRi 系统故障,总部统一指挥倒代。(2)预案原则 北京 MSC 具有 HLR 的功能,北京 MSC 将做成 HLRi 系统的冷备份,在HLRi 主备用系统都宕机时,在北京 MSC 上进行数据修改,由北京 MSC 承担HLR 的功能。由于涉及全网数据,预案各步骤的执行由总部统一指挥。(3)应急措施 901041XXXXX 上海 FAS 上海 MSC 上海 MSC武汉 TMSC 方向的业务倒代示意图 上海专网 741XXXX 上海调度 抢修组确认预案启动前提成立,参照应急通信故障的报告和通报流程制度启动应急预案。北京 MS

33、C 进行数据修改,由北京 MSC 承担 HLR 的功能。武汉 STP 修改HLR 指向到北京 MSC。抢修组在总部指挥下开始执行倒代。a.倒代方案示意 b.技术台帐 网元名 信令点 武汉 STP 42-255-22 北京 MSC 42-255-21 c.操作命令行 倒代命令(执行完后进行拨测确认):MODSIGDP:NETID=4,DPC=42-255-21,Admin state=LOCKED;当 HLRi 故障修复后,由总部统一指挥执行恢复。恢复命令(执行完后进行拨测确认):MODSIGDP:NETID=4,DPC=42-255-21,Admin state=UNLOCKED;9)与 BS

34、C 系统局向全部中断(一级)武汉 STP 上海 MSC 上海 MSCHLRi 系统故障业务倒代示意图 北京 STP HLRi (1)启动前提 MSC 与 BSC(TRAU)局向全部中断,影响该 BSC 范围的 GSM-R 终端无法使用。(2)预案原则 尽快恢复通信,若原因为物理连接引起,用临时通道恢复业务;若为硬件故障,立即更换损坏硬件;若为软件故障,立即由厂家现场技术支持进行解决。(3)应急措施 抢修组确认预案启动前提成立,参照应急通信故障的报告和通报流程制度启动应急预案。抢修组组长汇报实时情况于领导小组,抢修组对故障进行原因排查。如果确认原因为物理连接引起,查找 BSC 的台帐,确定链路

35、2M 所在,要求传输室先代通带链路的通道,再最大限度恢复该 BSC 最低通信容量要求,当原有物理连接修复后恢复原状。若为硬件故障,立即更换损坏硬件。若为软件故障,立即由厂家现场技术支持进行解决。10)与 RBC 机房互联电路全部中断(一级)(1)启动前提 对 RBC 机房互联电路全部中断。(2)预案原则 不能影响原有正常业务,如有影响,处理须在天窗时间进行。(3)处理措施 目前,我们在虹桥 RBC 通信机房上了两套 ONS3500:RBC01 和RBC02。共布放 2 条光缆一条 32 芯、一条 30 芯,32 芯中的 1-4 芯与 RBC 机房相连的 RBC01 传输设备上,30 芯中的 1

36、-4 芯与 RBC 机房相连的 RBC02 传输设备上。再由传输设备 RBC01、RBC02 下 2M 电路与 RBC 通信设备相连。日常维护中观察 MSC 网管告警信息:1.是光纤故障,由虹桥核心网机房值班人员倒换 GSM-R 机房到 RBC 机房的两端光纤,调至备用光纤。2.是电路故障,立即联系虹桥 RBC 机房值班人员,根据备用电路命名进行倒代,再对故障电路进行端对端的误码测试。3.两条光缆同时都断,虹桥 RBC 传输中断,虹桥 RBC 业务全中断,此时影响沪宁沪杭京沪 3 条高铁线,沪宁RBC 有 5 个共 25 个 2M、沪杭 RBC 有 3 个共 15 个 2M、京沪 RBC 有

37、6 个共 30个 2M,虹桥核心网机房值班人员立即布放临时光纤到虹桥 RBC 机房大约200 米,通过两头接 PDH 临时接通 2M,按最低接通标准每个 RBC 一条 2M 链路,共需接通 14 条 2M,按 8 路 PDH 连接,需 2 对 PDH。GSM-R 工区光缆、电路及端口如下表:纤芯号 1 2 3 4 5 6 南 辅-RBC 32 芯 B 缆(外圈)业务 名称 RBC1-南一 622M RBC1-南一 622M RBC1-南一 622M RBC1-南一 622M 备用 备用 跳纤 去向 1553 南辅 13-SLQ4-3-R 1553 南辅 13-SLQ4-3-T 1553 南辅

38、13-SLQ4-4-R 1553 南辅 13-SLQ4-4-T 备用 备用 纤芯号 1 2 3 4 5 6 南 辅 业务 名称 RBC2-南二 622M RBC2-南二 622M RBC2-南二 622M RBC2-南二 622M 备用 备用-RBC 20 芯 A 缆(内圈)跳纤 去向 1554 南辅 6-SLQ4-3-T 1554 南辅 6-SLQ4-3-R 1554 南辅 6-SLQ4-4-T 1554 南辅 6-SLQ4-4-R 备用 备用 1566 新 RBC1 1567 新 RBC2 传输端口 业务名称 传输端口 业务名称 传输端口 业务名称 传输端口 业务名称 4PQ1-1 沪宁R

39、BC1-3 4PQ1-21 京沪RBC7-1 4PQ1-1 沪宁RBC1-1 4PQ1-21 京沪RBC7-2 4PQ1-2 沪宁RBC2-3 4PQ1-22 京沪RBC7-5 4PQ1-2 沪宁RBC2-1 4PQ1-22 京沪RBC8-2 4PQ1-3 沪宁RBC3-3 4PQ1-23 京沪RBC8-1 4PQ1-3 沪宁RBC3-1 4PQ1-23 京沪RBC9-2 4PQ1-4 沪宁RBC4-3 4PQ1-24 京沪RBC8-5 4PQ1-4 沪宁RBC4-1 4PQ1-24 京沪RBC10-2 4PQ1-5 沪宁RBC5-3 4PQ1-25 京沪RBC9-1 4PQ1-5 沪宁RBC

40、5-1 4PQ1-25 京沪RBC11-2 4PQ1-6 沪宁RBC3-5 4PQ1-26 京沪RBC9-5 4PQ1-6 沪宁RBC1-5 4PQ1-26 京沪RBC12-2 4PQ1-8 沪杭RBC1-1 4PQ1-27 京沪RBC10-1 4PQ1-7 沪宁RBC5-5 5PQ1-21 京沪RBC7-4 4PQ1-9 沪杭RBC2-1 4PQ1-28 京沪RBC10-5 4PQ1-10 沪杭RBC1-3 5PQ1-22 京沪RBC8-4 4PQ1-10 沪杭RBC3-1 4PQ1-29 京沪RBC11-1 4PQ1-11 沪杭RBC2-3 5PQ1-23 京沪RBC9-4 4PQ1-11

41、 沪杭RBC1-5 4PQ1-30 京沪RBC11-5 4PQ1-12 沪杭RBC3-3 5PQ1-24 京沪RBC10-4 5PQ1-1 沪宁RBC1-4 4PQ1-31 京沪RBC12-1 4PQ1-13 沪杭RBC3-5 5PQ1-25 京沪RBC11-4 5PQ1-2 沪宁RBC2-4 4PQ1-32 京沪RBC12-5 5PQ1-1 沪宁RBC1-2 5PQ1-26 京沪RBC12-4 5PQ1-3 沪宁RBC3-4 5PQ1-21 京沪RBC7-3 5PQ1-2 沪宁RBC2-2 5PQ1-4 沪宁RBC4-4 5PQ1-22 京沪RBC8-3 5PQ1-3 沪宁RBC3-2 5P

42、Q1-5 沪宁RBC5-4 5PQ1-23 京沪RBC9-3 5PQ1-4 沪宁RBC4-2 5PQ1-6 沪宁RBC4-5 5PQ1-24 京沪RBC10-3 5PQ1-5 沪宁RBC5-2 5PQ1-9 沪杭RBC1-2 5PQ1-25 京沪RBC11-3 5PQ1-6 沪宁RBC2-5 5PQ1-10 沪杭RBC2-2 5PQ1-26 京沪RBC12-3 5PQ1-10 沪杭RBC1-4 5PQ1-11 沪杭RBC3-2 5PQ1-11 沪杭RBC2-4 5PQ1-12 沪杭RBC2-5 5PQ1-12 沪杭RBC3-4 11)与北京武汉互联电路全部中断(一级)(1)启动前提 与北京武汉

43、互联电路全部中断。(2)预案原则 不能影响原有正常业务,如有影响,处理须在天窗时间进行。(3)处理措施 a.目前,虹桥 GSMR 设备与北京核心网间共 4 个 2M 电路互联,上海MSC 和北京 TMSC 互联两条 E1,一主用一备用,上海 SGSN 和北京 TMSC 互联两条 E1,一主用一备用。其对应关系按附表一内容所列。其中任一电路中断都不影响业务,若全部电路中断,会倒换到武汉 MSC,也不影响业务。电路名称 DDF 位置 设备端口 转接设备 京沪 2DL(沪宁城际北京TMSC/STP-上海 MSC 铁 01)DDF1-1-1 52PQ1-1 LTG 0-8-0 京沪 2DL(沪宁城际北

44、京TMSC/STP-上海 MSC 铁 02 DDF2-1-1 52PQ1-1 LTG 4-51-0 京沪 2DL(沪宁城际北京 STP-上DDF1-1-2 52PQ1-2 SGSN ET768 海 SGSN 铁 01)京沪 2DL(沪宁城际北京 STP-上海 SGSN 铁 02 DDF2-1-2 52PQ1-2 SGSN ET896 b.目前,上海 GSMR 设备与武汉核心网间共 12 个 2M 电路互联,其对应关系按附表一内容所列。如发现原电路运用故障,由 GSM-R 核心机房值班人员立即联系武汉GSM-R 核心机房值班人员,根据备用电路命名进行倒代,即采用人工倒接方式进行,具体倒接方案按附

45、表所列进行。电路名称 DDF 位置 设备端口 转接设备 沪汉 2DL(沪宁城际上海 MSC-武汉 TMSC/STP 铁 01)DDF1-1-3 52PQ1-3 LTG 0-40-0 沪汉 2DL(沪宁城际上海 MSC-武汉 TMSC 铁 01)DDF1-1-4 52PQ1-4 LTG 0-21-0 沪汉 2DL 备用 02 DDF1-1-5 52PQ1-5 沪汉 2DL(沪宁城际上海 SGSN-武汉 STP 铁 01)DDF1-1-6 52PQ1-2 SGSN ET769 沪汉 2DL(沪宁城际上海 MSC-武汉 TMSC 铁 03)DDF1-2-5 52PQ1-15 LTG 0-25-0 沪

46、汉 2DL 备用 01 DDF2-1-3 52PQ1-3 沪汉 2DL(沪宁城际上海 MSC-武汉 TMSC 铁 02)DDF2-1-4 52PQ1-4 LTG 5-7-0 沪汉 2DL 备用 03 DDF2-1-5 52PQ1-5 沪汉 2DL 备用 04 DDF2-1-6 52PQ1-6 沪汉 2DL(沪宁城际上海 MSC-武汉 TMSC/STP 铁 02)DDF2-2-4 52PQ1-14 LTG 4-54-0 沪汉 2DL(沪宁城际上海 MSC-武汉 TMSC 铁 04)DDF2-2-6 52PQ1-16 LTG 6-1-0 沪汉 2DL(沪宁城际上海 SGSN-武汉 STP 铁 02

47、)DDF2-2-6 52PQ1-17 SGSN ET897 12)MSC 个别进程或数据吊死(二级)(1)启动前提 交换机命令无法正常输出或者交换机系统无法正常工作但外围设备运行正常,通信业务无影响。(2)预案原则 保证通信业务不受无影响,处理时间须在天窗时间进行。处理后须进行业务验证。(3)响应措施 抢修组确认预案启动前提成立,参照应急通信故障的报告和通报流程制度启动应急预案。抢修组请示上级调度与铁路局协商在天窗时间,联系设备厂家说明具体的故障现象,由厂家现场或远程支持对设备进行低级别启机。低级别启机会短时间(不超过 5 分钟)影响设备运用。处理后须进行人机命令操作验证,并确认交换机系统工作

48、正常。以下分别是 CP 侧和 MP 侧个别进程或数据吊死的一般解决方法,具体按厂家技术指导执行。a.交换机 CP 侧个别进程或数据吊死 CP 侧操作命令:RECOVSSP:LEVEL=NSTART0;只对非呼叫处理的程序进行重启,硬件只针对 BAPM,对呼叫处理没有影响。当 BAPM 损坏时,BAPM/BAPS 进行倒换,系统自动对 BAPM 进行重启。RECOVSSP:LEVEL=NSTART1;对所有程序进行重启,影响正在进行的呼叫,已建立的呼叫不受影响。RECOVSSP:LEVEL=NSTART2;对 CP 的 PRO 加载 DATA(数据),所有程序进行重启,影响正在进行的呼叫,已建立

49、的呼叫不受影响。RECOVSSP:LEVEL=NSTART3;对 CP 的 PRO 加载 DATA 和 CODE,对所有程序进行重启,影响正在进行的呼叫,已建立的呼叫不受影响。b.交换机 MP 侧个别进程或数据吊死 RECOVLIC:LIC=1(2);由于 LIC 为 1、2 互为备份,操作时需逐个进行,以免影响业务使用。主要针对在 IWPSS7 时隙无法正常占用或创建 LINK 时不能正常激活时,需对 LIC 板进行重启。RECOVAMX:SIDE=0(1),ACCG=1(3);由于 ACCG 为 01 侧备份,操作时是逐侧进行,不影响业务使用。主要针对在 ATM 交换网中包括基本框(扩展框

50、)ACCG 或其他一些设备降级或故障时对 AMX 进行重启。RECOVASN:SIDE=0(1),ACCG=1;由于 ACCG 为 01 侧备份,操作时是逐侧进行,不影响业务使用。主要针对在 MP 基本框 ACCG 降级或故障时对 ASN 进行重启。RECOVMP:MP=1(2、3、4、7、8),DEPTH=selective recovery;用于对某个 MP 使用出现异常,对 MP 所有进程部分重启,对数据影响小。RECOVMP:MP=1(2、3、4、7、8),DEPTH=full recovery;用于对某个 MP 使用出现异常,对 MP 所有进程部分重启,对数据影响大。RECOVMP:

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 工作报告

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁