《爱立信系统新员工培训教材(上)(共49页).doc》由会员分享,可在线阅读,更多相关《爱立信系统新员工培训教材(上)(共49页).doc(49页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上员 工 培 训 教 材(GSM爱立信系统)江苏移动通信有限责任公司网络部2002年6月目 录1、全省网络结构图 1.1、全省GSM网三级网络结构图 1.2、全省短信网络结构图 1.3、全省GPRS网络结构图 2、交换及无线系统结构组成 2.1、系统结构与组成: 2.2、各主要单元的功能 2.3、爱立信设备中交换和无线系统的结构框图 3、系统故障和告警处理 3.1、典型硬件故障处理 3.1.1、CPS硬件故障处理 3.1.2、RPS硬件故障处理 3.1.3、GSS硬件故障处理 3.1.4、IOG故障处理 3.1.5、计费故障处理 3.1.6、七号信令故障处理 3.1.7
2、、基站故障处理 3.2、典型软件故障处理 3.2.1、出现软件故障 3.2.2、预防性的设定(OPI:Recovery Actions for Program Error, Set) 3.3、系统紧急恢复 3.3.1、当APZ出现故障导致System Stoppage时 3.3.2、有三种情况可能导致SYSTEM STOPPAGE 4、呼叫信令流程处理和局数据制作 4.1、位置更新(Location Updating) 4.1.1、位置更新-通常型( NORMAL) 4.1.2、位置更新-移动台关机(IMSI DETACH) 4.1.3、位置更新-移动台开机( IMSI ATTACH) 4.1
3、.4、位置更新-周期性位置更新 (PERIODIC REGISTRATION) 4.2、切换(Handover) 4.2.1、同一BSC内切换 4.2.2、BSC间切换 4.2.3、小区内切换 4.2.4、SDCCH切换 4.2.5、MSC间切换 4.2.6、相关局数据例子和说明 4.3、呼叫建立 4.3.1、MS发起呼叫 4.3.2、MS作被叫 4.4、短消息服务:(SHORT MESSAGE SERVICE) 4.4.1、移动台始发短消息(MOBILE ORIGINATED SMS) 4.4.2、移动台接收短消息(MOBILE TERMINATED SMS) 4.4.3、短信接收不成功(U
4、nsuccessful Mobile Terminated SMS Delivery) 4.4.4、移动台重新接入系统(Note MS Present) 4.5、增值业务中的呼叫转移 5、统计的定义及数据分析 5.1、交换机统计概述 5.1.1、OMS统计 5.1.2、STS统计 5.2、交换机统计定义 5.2.1、OMS统计定义 5.2.2、STS统计定义 5.3、 MSC话务统计数据分析 5.3.1、OMS统计报告分析 5.3.2、STS统计报告分析 5.4、 BSC话务统计分析 5.4.1、无线常用话务统计 6、无线系统工作原理及基站维护 6.1、GSM网络无线系统工作原理 6.1.1、
5、GSM无线资源 6.1.2、GSM信道类型 6.1.3、GSM的一个呼叫实例 6.2、RBS200数字移动基站的原理和维护 6.2.1、RBS200的硬件结构 6.2.2、工作原理 6.2.3、RBS200的故障处理 6.3、RBS2000基站的工作原理 6.4、OMT的使用 6.4.1、OMT的主要功能 6.4.2、OMT的结构 6.4.3、使用OMT所具备的条件 6.4.4、OMT 软件最常用的几种功能 7、OSS系统介绍 7.1、OSS系统(GSM Operations Support System)总述 7.1.2、OSS系统的硬件组成 7.1.3、OSS软件结构 7.2、OSS系统功
6、能介绍 7.2.1、基本应用层包含了最基础的网元管理信息应用工具 7.2.2、高层应用功能 7.3、如何新增加一个网元 7.4、如何新增加一条LINK 7.5、如何增加新用户 7.6、如何开启测量 1、全省网络结构图1.1、全省GSM网三级网络结构图 江苏的移动通信GSM网分信令网和话路网两部分,呈三级网络结构。信令网分高级信令汇接点(HSTP)、低级信令汇接点(LSTP)和业务信令点(SP:HLR、关口局GW、端局MSC/VLR等);话路网分一级话路汇接局(TMSC1即A)、二级话路汇接(TMSC2即B)和本地局(关口局GW、端局MSC)。【说明】A1/2局负责移动网省际长途话务汇接。B1/
7、2局负责省内长途话务汇接。江苏省有两对B局,分别建在南京和无锡,南京负责汇接苏北地区的省内长途话务、无锡负责汇接苏南地区的省内长途话务。HSTP1/2负责移动网内省际信令转接。LSTP1/2负责省内信令转接。江苏省建有两对LSTP,分别建在南京和无锡,南京负责转接苏北地区各设备间的信令、无锡负责转接苏南地区各设备之间的信令。SSP为智能业务中心,它和SCP、SMP负责完成固定用户用17951呼叫IP长途电话、省内VPMN移动业务。IP网关包括17951电话业务、17950电话卡业务、172XX上网业务、短消息网关,主要负责完成移动网络与IP网络之间的接口功能。1.2、全省短信网络结构图 我省短
8、信系统根据“少局所、大容量”的建设原则,全省建有7套短信中心。其中苏北SMC建在南京,提供连云港、宿迁、盐城、淮安、徐州、泰州地区的短信业务;无锡SMC提供无锡、常州、南通地区的短信业务;南京、苏州、扬州、镇江短信中心分别提供本地短信业务。MT短信中心专门完成点播等业务的短消息下发。 1.3、全省GPRS网络结构图 注:黄色网元为阿尔卡特设备,蓝色网元为爱立信设备。 如图所示,我省GPRS核心网设备(SGSNGGSN)分别设在南京、扬州、苏州,分别负责苏北、苏南和徐州本地的GPRS接入服务。GPRS网络通过SGSN与LSTP相连,完成与GSM网的信令交互,通过GGSN与CMNET相连,完成数据
9、交互。2、交换及无线系统结构组成 GSM为Global System For Mobile Communications的缩写,是目前全球移动通信系统中最主要的移动通信组网方式之一。本章主要介绍了其交换及无线系统的结构及组成。2.1、系统结构与组成:GSM系统框图: 其中:AUC:Authentication Center BGW:Billing GateWay BSC:Base Station Controller EIR:Equipment Identity Register FNR: Flexible Numbering Register GMSC: Gateway MSC HLR: H
10、ome Location Register ILR :Interworking Location Register IWU: InterWorking Unit MIN: Mobile Intelligent Node MS: Mobile Station MSC: Mobile services Switching Center MXE: Message CenterOSS: Operation and Support SystemRBS: Radio Base StationSMS-GMSC: Short Message Service, Gateway MSCSMS-IWMSC: Sho
11、rt Message Service InterWorking MSCSOG: Service Order GatewayTRC: Transcoder ControllerVLR: Visitor Location Register由图可见,GSM数字蜂窝通信系统的主要组成部分可分为移动台、基站系统和交换系统。 基站系统由BTS、TRC和BSC组成;交换系统主要由MSC、GMSC、HLR、VLR、AUC和EIR等组成。目前省内爱立信系统情况为:BSC均为TRC/BSC合一,简称BSC;HLR、AUC合设于一个物理实体中;MSC、VLR合设于一个物理实体中;暂时无EIR设备。2.2、各主要单元
12、的功能*移动台(MS)即便携台(手机)或车载台。也可以配有终端设备(TE)或终端适配器(TA)。移动台是物理设备,它还必须包含用户识别模块(SIM),SIM卡和硬件设备一起组成移动台。没有SIM卡,MS是不能接入GSM网络的(紧急业务除外)。 *基站收发台(BTS)包括无线传输所需要的各种硬件和软件,如发射机、接收机、支持各种小区结构(如全向、扇形、星状和链状)所需要的天线,连接基站控制器的接口电路以及收发台本身所需要的检测和控制装置等。 *基站控制器(BSC)是基站收发台和移动交换中心之间的连接点,也为基站收发台和操作维修中心之间交换信息提供接口。一个基站控制器通常控制几个基站收发台,其主要
13、功能是进行无线信道管理、实施呼叫和通信链路的建立和拆除,并对本控制区内移动台的越区切换进行控制等。*移动交换中心(MSC)是蜂窝通信网络的核心,其主要功能是对位于本MSC控制区域内的移动用户进行通信控制和管理。例如:1)信道的管理和分配;2)呼叫的处理和控制;3)越区切换和漫游的控制;4)用户位置信息的登记与管理;5)用户号码和移动设备号码的登记和管理;6)服务类型的控制;7)对用户实施鉴权;8)是系统中连接其它MSC,并为其它公用通信网络如公用交换电信网(PSTN)、综合业务数字网(ISDN)和公用数据网(PDN)提供链路接口。保证用户在转移或漫游的过程中实现无间隙的服务。由此可见,GSM交
14、换系统(MSC)的功能与固定网络的交换设备有相似之处(如呼叫的接续和信息 的交换),同时具备了移动通信系统的特殊功能(如无线资源的管理和适应用户移动性的控制)。 *归属位置寄存器(HLR)是一种用来存储本地用户位置信息的数据库。在蜂窝通信网中,通常设置若干个HLR,每个用户都必须在某个HLR(相当于该用户的原籍)中登记。登记的内容分为两类:一种是永久性的参数,如用户号码、移动设备号码、接入的优先等级、预定的业务类型以及保密参数等;另一种是暂时性的需要随时更新的参数,即用户当前所处位置的有关参数,即使用户漫游到HLR所服务的区域外,HLR也要登记由该区传送来的位置信息。这样做的目的是保证当呼叫任
15、何一个不知处于哪一个地区的移动用户时,均可由该移动用户的归属位置寄存器获知它当时处于哪一个地区,进而建立起通信链路。 *访问位置寄存器(VLR)是一种用于存储来访用户位置信息的数据库。一个VLR通 常为一个MSC控制区服务,也可为几个相邻MSC控制区服务。当移动用户漫游到新的MSC 控制区时,它必须向该地区的VLR申请登记。VLR要从该用户的HLR查询有关的参数,要 给该用户分配一个新的漫游号码(MSRN),并通知其HLR修改该用户的位置信息,准备为其它用户呼叫此移动用户时提供路由信息。如果移动用户由一个VLR服务区移动到另 一个VLR服务区时,HLR在修改该用户的位置信息后,还要通知原来的V
16、LR删除此移动用户的位置信息。 *鉴权中心(AUC)的作用是可靠地识别用户的身份,只允许有权用户接入网络并获得服务。*设备标志寄存器(EIR)是存储移动台设备参数的数据库,用于对移动设备的鉴别和监视,并拒绝非移动台入网。在我国,没有使用本设备。GSM网路除了包括它本身的子系统外,作为公用通信网的组成部分,它还可以连接:公用交换电话网(PSTN)综合业务数字网(ISDN)分组交换公用数据网(PSPDN)电路交换公用数据网(CSPDN)公用陆地移动通信网(PLMN)在GSM系统内各主要功能单元之间和GSM移动通信网与其它相连接的通信网之间都有规定的接口与信令,如图所示。 2.3、爱立信设备中交换和
17、无线系统的结构框图1、交换系统结构:目前在运行的爱立信交换机有BYB202和BYB501两种类型,其结构分别见下图(一)、(二): 图(一) 图(二)2、无线系统结构:(1)现网BSC结构: (2)现网爱立信基站结构框图RBS2000基站结构框图: Here3、系统故障和告警处理3.1、典型硬件故障处理3.1.1、CPS硬件故障处理 当CP出现硬件故障导致CP FAULT告警出现时,我们首先察看CP的状态,若状态为DPWSP; CP STATE MAU SB SBSTATE NRM B WO 为正常状态,则留到晚上低话务量时处理;其余均为不正常状态,必须马上根据OPI:CP FAULT的ACT
18、IONS进行处理: REPCI;诊断。 同时出现O1告警:SYSTEM STATE REPAIR OF CP OR MAU。诊断结果有两种情况: 1.无怀疑板块列出。 RECCI;检修,将告警消掉。 2.有怀疑板块列出。 a.错误类型为Permanent(永久性)。我们根据提示选择最怀疑板块,准备更换。REMCI:MAG= ,PCB= ;此刻系统将所需换的板子隔离出来,我们根据提示,按顺序关电,换板,再开电。 RECCI;检修。成功,则CP FAULT告警消失,O1告警消失,CP状态恢复正常。若不成功,则CP FAULT告警仍在,O1告警仍在。此时最好再次进行诊断。注意,在再次诊断之前,只要有
19、O1告警在,就须先将上次诊断进程结束: REPCE;O1告警消失。 REPCI;再次诊断。 REMCI:MAG= ,PCB= ;选择最怀疑板块关电换板。 RECCI;检修。成功,OK。不成功,则重复上述四步。 b.错误类型为Temporary(临时性)。 若所有的最怀疑板块在最近30天内都换过,则用: DIRCP; DIRRP;收好报告,留待爱立信专家分析。 REPCE;将诊断进程结束。 若尚有板块可以更换,则参照错误类型为Permanent进行。 3.1.2、RPS硬件故障处理 当RP FAULT告警出现时,如闭解RP无效,则根据流程得出要更换的硬件,进行替换。若无告警,而又想直接换板,则需
20、用SARPI使RP BUS不再交替,再将RP闭掉替换,结束后用SARPE使RP BUS恢复交替控制。所用指令如下: REPRI:RP= ; REMRI:RP= ,PCB= ;此时系统将此RP隔离出来,我们根据提示更换板子。 用EXPOP:RP= ;来查找硬件位置。 RECRI:RP= ; EM是交换机中最小的控制单元。当EM FAULT告警出现时,如闭解EM无效,则根据此EM所管硬件的具体类型来处理。对EM的操作指令如下: REPRI:RP= ,EM= ; REMRI:RP= ,EM= ,PCB= ; RECRI:RP= ,EM= ;此EM有可能是ETC,TSM或其他。我们根据不同的硬件类型进
21、行更换。 3.1.3、GSS硬件故障处理 和GS相关的告警共有两种:GROUP SWITCH FAULT和GROUP SWITCH TRAFFIC RESTRICTION 出现第一种告警时,表示TSM,SPM,CLM或所连的SNT发生问题。常用指令如下: GSSTP; GSBLI; GSTEI; GSBLE; 测试通过则解闭,告警消失。测试不通过,则根据不同的硬件类型进行更换。假设交换机TSM-B-14出现告警,而且只有更换板子才能解决问题。在目前普遍使用的BYB501硬件中,一块TS4B板子集合了四个TSM,所以首先要知道TSM-B-14和其它哪三个TSM集合在一块板子上。将14除4取整得3
22、,再乘4得12,得知TSM-12、TSM-13、TSM-14、TSM-15在一起,再找到相应的EM,将这些设备全闭掉后,才可以更换板子。如果开局时交换机数据定义得比较详细的话,也可用指令:EXPOP;来定位TSM。第二种告警表示因硬件错误而引发每一边至少一个单元被闭掉。3.1.4、IOG故障处理 SP的告警有如下几种: SP Unit Fault:SP中发生永久性故障。 SP Node Fault:系统与NODE失去联系。 SP Link Fault:LINK(RPA)发生与RPB或CP无关的故障。 SP Node Restarted:一个NODE发生重启动。 MCS和DCS的告警有如下几种:
23、 Line Unit Blocked:LU发生问题。 Port Blocked:数据线或终端与PORT的连接中断。 Ali Fault:告警界面发生问题。 上述告警我们可以根据各自的OPI流程来处理。常用的指令有: RESUP:SPG= ,NODE= ;显示有故障的PCB列表。 RESUI:SPG= ,NODE= ;检测节点。 DISUI:SPG= ,NODE= ,UNIT= ;开始诊断SP Unit。 DISFP:SPG= ,NODE= ;显示故障检测记录。 IMALP:NODE= ;查看SPS的EVENT LOG。 IMTLP:NODE= ;查看SP Trace System LOG。 I
24、NATP:NODE= ,IO= ;查看IO Unit的属性。 INIOP:NODE= ;查看IO Unit。 INLIP:NODE= ,IO= ;查看IO Unit Life Time Performance。 3.1.5、计费故障处理 计费信息由Block:CHCDR(Charging Co-ordination Of Data Recording)搜集,传至CHOF(Common Charging Output Function)进行格式化,再将格式化好的数据传至CHOD(Common Charging Output Destination),由CHOD选择是Dump至OD上,还是通过Da
25、ta Link传送至BGW或Billing Center。 具体来说,计费信息先存在CP的Buffer缓冲区内,然后送至IOG的TTFILE存储。TTFILE文件类型为CMP,定义有子文件。当子文件满足Maxsize和Time两个条件其中之一时,即被Report至FPU (File Process Utility),由FPU负责将其传走,或是Dump至OD上,或是通过Data Link传至BGW或Billing Center。同时该子文件也被从硬盘上删除。当由于某种原因系统没能自动删除计费子文件,或IOG出现问题导致TTFILE不能继续存储计费文件,则CP缓冲区内的计费信息无法送走,CP不能计
26、费,则会立即中断话务。这也是非常紧急的故障。 当计费出现Common Charging Output Error告警导致话务中断时,我们应立即采取相应的措施如下: 1.IMMCT:SPG=0; :IMCSP; :END; 如状态正常,则 2.CHOFP:FN=TT;看当前打开的计费文件,一般是TTFILE00。 CHOFI:FN=TT,FILEID=01;打开SPG0中的计费文件。 CHOFE:FN=TT,FILEID=00;关闭SPG1中的计费文件。若存在Block状态,则相 关命令为:CHOBI:FN=TT,FILEID=01; CHOBE:FN=TT,FILEID=00; 3.SAAEP
27、:SAE=500,BLOCK=CHOF;确认NIU迅速下降,并恢复到正常水平。然后我 们再定下心来检查并使SPG1恢复正常计费功能。 4.检查SPG1状态: IMMCT:SPG=1; :IMCSP; :END; BLSNI:SPG=1,NODE= ;人工闭塞SB-Node。 SYRSI:SPG=1,NODE= ,RANK=RELOAD;对EX-Node做重载启动。 BLSNE:SPG=1,NODE= ;EX-Node状态为Working Normal时,解闭SB-Node。 5.若是因为有垃圾文件(即因某种原因系统没能自动删除的计费子文件)的存在导 致计费故障时,我们可以看一下: INMCT:
28、SPG=1; :INVOP:VOL=CHARVOLUME; :INFIP:FILE= ; :END; 如发现有垃圾文件,在确认此子文件已发给计费中心并做过Dump后将其从硬盘上删除。 6.INFUE:FILE=TTFILE00-XXXX ;将记费子文件从FPU的List中删掉。 INMCT;SPG=1; :INFIR:FILE=TTFILE00-XXXX ;将记费子文件从硬盘中删掉。 :END; 7.当原先计费的SPG1恢复正常后,我们要尝试将计费倒回去。 CHOFI:FN=TT,FILEID=00; SAAEP:SAE=500,BLOCK=CHOF;确认NIU始终维持在较低的水平。 IOIF
29、P:FILE=TTFILE00; IOIFP:FILE=TTFILE01; INMCT:SPG=0; :INFIP:FILE=TTFILE01-XXXX; :END; INMCT:SPG=1; :INFIP;FILE=TTFILE00-XXXX; :END; 确认两个子文件的SIZE同步增长。 CHOFE:FN=TT,FILEID=01; 关闭SPG0的计费功能。 CHOFP:FN=TT; 确认状态已改回。 还有一种解决办法是先Small Restart,清空CP的 Buffer,再删除部分计费文件。 3.1.6、七号信令故障处理 有关七号信令系统的告警有如下几种: CCITT7 DESTIN
30、ATION INACCESSIBLE:信令网中的某个信令点无法被访问。 相关指令:C7RSP:DEST= ; CCITT7 LINK SET SUPERVISION:如果两个交换局之间有很多的信令链路,就要通过指令设置告警门限。若被闭掉的链路数大于告警门限便会发生此类告警。 相关指令:C7SUC:LS= ,LVA= ,ACL= ,DMI= ;其中LVA表示告警门限,DMI表示发出告警前的时延。 C7SUP:LS= ; CCITT7 SIGNALLING LINK FAILURE:如果信令链路由于故障而被闭掉,就会出现这种告警。该故障可能是交换机其他部分的故障,如RP、EM或信令终端被闭掉。详细
31、处理可参照OPI。 相关指令:C7LTP:LS= ; C7LAE:LS= ,SLC= ; C7LAI:LS= ,SLC= ;3.1.7、基站故障处理1.装载基站文件 84000:定义RBS200的EMG、CLC 85000:定义小区参数,频点,监测告警 86000:定义相邻小区切换参数 87000:定义MO 94000:定义传输 97000:装载载频 2.基站相关指令 rxbli:mo=rxo(e)ts,tx,rx,trx,is,odp,cf;闭 rxese:mo=rxo(e)ts,tx,rx,trx,is,odp,cf; 拆 rxesi:mo=rxo(e)ts,tx,rx,trx,is,od
32、p,cf; 装载 rxble:mo=rxo(e)ts,tx,rx,trx,is,odp,cf; 解闭3.2、典型软件故障处理3.2.1、出现软件故障 对于软件故障(Software Faults),用 SYRIP;或 SYRIP:SURVEY/LOG;可以看出一些出错信息。 其中Event Code是这次事件的编码,INF1是功能块号码,INF2表示运行至何地址时出现问题。我们可以用 SYRIP:EVENT= ;来具体看某次事件的信息。例如: 当INF1=H02CB,INF2=H2DB1时,我们可以用 PCODP:BLOCK=H02CB,IS=H2DA0-H2DC0;来看包含地址H2DB1的这
33、一段程序的信息。当交换机的程序有问题时,ERICSSON的专家通常会针对问题编写补丁,打入交换机,来进一步完善程序,解决问题。 PCORL:BLOCK= ,CI= ;装载补丁。 : : : :END; PCORI;激活补丁,程序地址跳去补丁区执行。 PCORP:BLOCK= ; PCORI:BLOCK= ,IA= ;3.2.2、预防性的设定(OPI:Recovery Actions for Program Error, Set) 当CP的硬件出错时,会出现CP FAULT告警,我们可以用上述三条指令诊断和修复。当CP的软件出错时,若是较大的错误,系统会立刻自动Restart来恢复正常。对于软件
34、错误的恢复性行为共有五种类型:Small Restart,Large Restart,Large Restart with Reload,Selective Restart,Forlopp Release。对于比较小的软件错误,Selective Restart可以Delay an Automatic System Restart,使Restart避开忙时,减低对话务的影响。Forlopp来自瑞典语,意即事件的序列(事件链),具体说来即一些功能块的软件Devices连在一起完成一次事件,称为一个Forlopp。我们可以用Forlopp Release的方法来恢复一些更小的软件错误。 延缓和制止
35、Restart取决于发生错误的功能块(Function Block)的类别(Category),Restart的错误代码(Fault Code),时间以及预先发现的错误。常用指令如下: 1.改变Selective Restart的状态 SYRAP:SELRES; SYRAC:SELRES=selres; 2.改变功能块的类别 SYBCP:BLOCK= ; SYBCS:BLOCK= ,CATEGORY= ;(Category的值为03) 3.改变错误密度门限值 SYELP; Print the current limit for the software error intensity SYEL
36、R; Remove the error intensity limit SYELS:LIMIT= ,DCAT= ;可以自己定,但什么样的错误产生多大的值由系统缺省。一般DCAT=0表示工作日,12表示星期天,3表示节假日,4自定义。 4.改变Forlopp Release功能的状态 SYRAP:FORLOPPRES; SYRAC:FORLOPPRES=forloppres; 5.改变Forlopp Execution状态 SYFSP;其中Forlopp Handling即Flstatus一般是Active。Forlopp Execution Control Function (ECF)即fle
37、cf表示功能块之间还要互传Forlopp ID,若不一样,则不执行,为了降低CP负荷,一般选择Off。Forlopp Error Function (Flerror)即flerr表示发现FID不对是否报告CP,一般也选择Off。Forlopp Mode即flmode,若设成Test,表示每个Block和Forlopp都要向CP报告,设成Operation表示CP只要每个Forlopp的首尾。 SYFSC: ; 6.对于Forlopp还有一些常用指令: SYFAP;可以看出当前有哪些Forlopp是激活的。 SYFIP:FID= ; SYFRI:FID= ,BLOCK= ,FILENUM= ,I
38、ND= ; SYFDP; SYFDC:START/STOP,DURATION= ,ALARM= ; 我们在看告警的时候,可以用ALLIP:ACL= ,FID=YES;看这个告警的Forlopp ID。对于一些假告警,可以用Forlopp Release的方法将它人工释放掉。 在SYRAC:SELRES=ACTIVE ;中设定Selective Restart为Active,若Type设为Small delayed,当出现软件故障时,会有Small Restart Is Pending(排队)的告警。此时我们可以用 SYRTP; SYRTS:RANK=SMALL,TIME= ;来设定时间。 当然
39、这要根据软件故障的危险性来定,危险性一般的小故障可以用Delay Restart。在上述五种类型的Recovery Actions中,Forlopp的级别最低,Forlopp Release不行则选择Delay Restart,还不行则只好选择立即Restart。3.3、系统紧急恢复3.3.1、当APZ出现故障导致System Stoppage时 我们通常采用的恢复方法有: 1.Restart without reload using the I/O system。 SYREI:RANK=SMALL; 2.Restart without reload using CPT system。 PTS
40、RI:RANK=SMALL; 3.Reload by function change method(通常用于软件升级,打补丁,修改)。 分离CP,分离Link,从硬盘通过分离的Link Load至分离的CP,要求CP的硬件和MAU都是好的。FCCPL:FILE= ; 4.Restart with reload using I/O system。 SYREI:RANK=RELOAD;Reload至执行侧。 5.Reload by CPT command。 分离CP,分离Link,给分离的CP Load 软件。 PTCPL:CS= ,FILE= ,RP= ; 6.Reload without us
41、ing the I/O system or CPT即FEX Reloading。 此时一定Load Relfsw0,如果想Load其他Relfsw,必须用改名的方法。3.3.2、有三种情况可能导致SYSTEM STOPPAGE 软件错误,CP两侧均有硬件故障,电源故障。其中对于交换机来说,最紧急的故障莫过于软件错误引起的系统Cyclic Restart(循环启动),此时终端不能与CP正常通信(OPI:System Start/Restart,Manually Initiate)。 为了快速恢复话务,我们首先要检查: 1.IOG OK?因为我们要使用Local Mode。 2.CPT OK?因为
42、我们要用CPT方式做Loading。 3.Traffic?交换机还能支持话务吗? 4.Reload relfsw0 OK? 5.If reload relfsw0 not OK,Try relfsw1 OK? 我们一般不用FEX Reloading 方式,因为CP关电后Cyclic Restart的信息全部被清掉,用SYRIP:SURVEY;看不到有关信息,不便于追查原因。只要能用CPT方式,尽量用CPT方式。 CPT Loading 方式:(要求IOG OK,CPT OK且至少有一侧CP的硬件OK,有一个Backup File OK) 1.进入Local Mode,连上CPT: PTCOI; 2.分离CP的SB侧,分离Link。 手动分离方式:按下RPV2(即Link)上的Mode键。 使PHCI钮(程序故障诊断)ON(CP-A&CP-B)。 3.Test CP(SB/SE侧),Loading CP。 PTCPL:CS=B,FILE=RELFSW0; 4.分离终端,使之与分离的CP进行联系