故障响应机制1.2精要.docx

上传人:e****s 文档编号:88147430 上传时间:2023-04-22 格式:DOCX 页数:21 大小:286.44KB
返回 下载 相关 举报
故障响应机制1.2精要.docx_第1页
第1页 / 共21页
故障响应机制1.2精要.docx_第2页
第2页 / 共21页
点击查看更多>>
资源描述

《故障响应机制1.2精要.docx》由会员分享,可在线阅读,更多相关《故障响应机制1.2精要.docx(21页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、 故障响应机制北京傻+逼信息技术2014年12月目 录1引言1编写目的1适用范围12故障2故障分类2故障响应时间表43故障定级5故障累积升级5处理能力不足5客户关注程度5客户反馈故障升级6客户监控出现的问题6故障定级矩阵74现场人员注意事项85故障响应人员96处理流程10一级故障10二级故障11三级故障13四级故障147事后总结161 引言1.1 编写目的由于生产环境中经常会出现各种故障,一般通过两种途径:公司方人员发现、银行方人员告知。现场人员会发现问题不知道如何解决,也不知道该通知谁解决,经常会出现处理延误、沟通不畅等问题,导致客户满意度下降,客户信任度下降。另外现场人员要加强自身的沟通能

2、力,第一要安抚客户、告知客户公司已经进行处理,第二要能简明扼要的说明现场情况、客户关注程度、问题导致结果等。本文档旨在提供一个规范化的流程,让现场人员做到有章可循,针对不同的故障级别找到响应的处理人员。从故障处理上,不仅可以体现公司的专业性,也能提高客户满意度。1.2 适用范围项目组的所有人员需要了解,在故障出现的时候能第一时间进行处理。领导组需要进行了解,知道各种级别的领导需要沟通。2 故障2.1 故障分类故障按照产生的后果进行分类,共分为四类。故障等级 故障说明 响应时间处理时间一级 一级故障:客户端无法使用,影响用户正常使用。当系统出现下列相当严重的现象时,属一级故障: 系统后台服务器整

3、体瘫痪,全部操作失去响应; 客户端(安卓、iPhone、iPad等仅一种出现)崩溃、无法进入用户界面; 发生间歇性、随机性、重复性的启动或应用退出,无法保障客户业务的正常处理。 两个二级故障及以上,升级为一级故障2小时1天二级 二级故障:客户端整体可以使用,部分出现问题,影响用户的部分业务处理。当系统出现下列比较严重的现象时,属二级故障: 系统后台出现了部分问题,导致用户使用出现问题; 客户端(安卓、iPhone、iPad等仅一种出现)部分功能失效,影响用户使用; 系统整体性能严重下降,无法自动恢复正常运行状态; 重要数据、参数和配置信息损坏,无法恢复,导致客户数据及业务记录严重损失; 三个三

4、级故障及以上,升级为二级故障3小时2天三级 三级故障:客户端可以使用,出现的问题对用户的业务处理影响不大。当系统出现下列现象时,属三级故障: 服务器端软件或者硬件出现异常,局部功能受限,系统整体仍可正常工作,对客户业务影响不大或存在隐患; 关键备用设施因故障离线,主用设施仍能正常工作; 后台日志发现有系统出现问题的趋势,或者已经出现了交易成功率下降 客户端性能小幅下降,但不影响使用; 系统运行指标(例如: I/O 效率、 CPU 效率)受到直接或间接影响,客户业务处理受小量影响; 五个四级及以上,升级为三级故障6小时3天四级 四级故障:客户端可以使用,不影响业务处理当系统出现下列情况而不影响客

5、户业务时,属四级故障: 客户端界面出现显示问题,如ui不符合设计; 后台系统中有大量的冗余信息,导致空间不足; 系统硬件或者软件没有及时升级,不符合安全策略等等 12小时 5天1.2.122.12.22.2 故障响应时间表故障等级 通知公司响应人员作出解决方案赶到现场解决时间一级15分钟2小时8小时24小时二级30分钟3小时12小时48小时三级60分钟6小时24小时或无需到现场72小时四级90分钟12小时无需到现场120小时3 故障定级3.1 故障累积升级按照不同的故障分类需要进行相应的处理,但是有时问题会重复出现或者同类问题出现了多个,进行故障升级。例如:开发人员发现了一个ui问题,这是一个

6、四级故障,他应该通知他的组长进行统筹处理,在该组长进行处理时发现了十个类似的问题,这个问题直接升级到三级故障,由该组长负责向项目经理通知,并进行全面查找问题,进行统一解决,做到故障的全部解决。四级故障数 = 5,升级为三级故障三级故障数 = 3,升级为四级故障二级故障数 = 2,升级为二级故障3.2 处理能力不足现场人员如果在接到处理命令后,在两个小时内确认自己无能力处理该故障,那么要求责任人将故障升级,联系更高级别人员,进行统筹工作。如:发现一个后台日志异常,有明显变坏的趋势,且银行方已经发现了交易量有少量下降,这应该是一个三级故障,在内部响应后项目经理和高级开发人员进行了处理,但是找不到问

7、题所在,那么直接上升故障等级,通知领导协调更高级的技术人员进行处理。3.3 客户关注程度客户的关注程度较高时,故障等级应做升级,如果现场人员不能确定客户是否关注程度比较高,可以通过以下几点进行判断: 客户语气焦急,明显有些不耐烦,明令快速解决 客户话语中透露出某某领导派他过来问,或者某某领导等着看,等等 客户表明因为这个系统的问题,导致其他系统无法正常运作 客户已经直接联系领导反映情况(这是非常糟糕的情况,中会有说明)如果还不能判断出客户的关注程度,那么直接打 给项目经理,如果项目经理也不能判断出客户关注程度,则按照客户关注程度一般处理。客户关注程度高时,故障+1级(如原故障二级,+1后变一级

8、),已经是一级的无法再升级。关注程度一般时,不做故障升级。3.4.33.13.4 客户反馈故障升级如客户遇到了故障,没有通知现场人员或者项目负责人员。而是直接联系了部门领导或者公司领导,那么故障响应要做相应升级。如果故障是用户发现的,故障一般都在三级以上,那么按照用户的响应级别进行故障定级。例如:如果反馈用户是银行总经理级别的,即使是三级故障,也要按照一级故障进行响应。原则上是找到公司与用户级别对等的领导,该领导在响应机制的哪个级别,故障就升级到哪个级别。 银行总经理对应公司总经理,定为一级故障 银行科技(信息)部经理对应公司交付中心总经理,定为一级故障 银行科长级别对应公司交付中心总监,定为

9、二级故障如果客户反馈的故障,按照故障标准认定的等级大于用户反馈认定的故障大于,那么以故障标准认定为准。3.5 客户监控出现的问题银行都有一些监控体系,可以从中查看到各种异常情况,这些异常情况可能是已经出现了问题的,也可能是即将出现问题,这些一般都是由技术人员解决。此类问题一般按照二级故障处理,如果客户关注程度较高,则需要公司相应人员进行沟通,如果客户关注度不高,直接协调技术人员解决。解决后,须告知银行相关负责人。3.6 故障定级矩阵颜色说明一级二级三级四级故障现象按照标准客户关注度一般客户关注度高行方科长反馈问题行方信息部经理反馈问题行方总经理反馈问题故障积累(按照3.1所述)处理能力不足公司

10、内部重视程度高 无法使用一级一级一级一级一级一级一级一级一级部分无法使用二级二级一级二级一级一级一级一级一级小部分无法使用三级三级二级二级一级一级二级二级二级不影响使用四级四级三级二级一级一级三级三级三级4 现场人员注意事项 遵守银行现场的各项制度管理规范,维护公司声誉和形象,不允许有损公司声誉形象的事情发生。 重视自身的沟通,日常工作中不要抱怨,不说一些可能会伤害客户的话,这样可能让用户积累一些怨气,在出现问题时候一并爆发。做到在现场的人员工作期间少说些与工作无关的事情 在问题出现的时候,现场人员放下手头的原有工作(指原定的任务,与本次故障无关的任务),全心的投入的故障处理工作中。第一,做好

11、沟通协调员,将现有问题向上汇报。第二,从容不迫应对,安抚客户心情,告知公司已经处理(人员已经在路上等等)。第三,积极配合客户,做好现场工作。第四,小心谨慎,不要手忙脚乱,此时不能再犯错误。 技术人员提高技术能力,多了解公司的框架、操作系统和一些日常使用的中间件,不要因为自己的粗心大意,导致系统瘫痪。做到修改前先备份。修改后先检查,备份保留而不删除。 重视质量意识,加强代码自查,按照流程规范行事,从自身减少隐患 现场人员要留有各个内部联系人的 ,邮箱,必要时可以贴在工位上,不要出现问题再去找人问 号码 明确自己的职责,了解其他人员(特别是领导)的职务和职责,了解每级别的责任人和联系人5 故障响应

12、人员按照华北交付中心的组织架构一级故障对银行响应人员:交付中心总(副总)经理,责任人项目经理二级故障对银行响应人员:交付中心总监,责任人:项目经理三级故障对银行响应人员、责任人:项目经理四级故障对银行响应人员:项目经理,责任人:项目组长(项目经理)6 处理流程6.1 一级故障一级故障是最高级别的故障,要求在我方的第一发现人在五分钟内告知项目经理,在故障发生的15分钟以内联系到交付中心对应响应人员(交付中心总经理)。在故障发生的15分钟内进行故障的现象及后果等的描述,之后交由领导统一指挥。在两个小时内对问题作出相应的处理方案,以最快速度组织人员到现场处理工作。要求技术总监、项目经理、技术专家、硬

13、件系统专家在故障发生的8小时内赶到现场。如人员无法到齐,可派同等级别人员替换。领导无法到场,可以 指挥。如现场问题严重,可要求公司副总与银行方领导进行沟通协调。一级故障要在24小时之内解决,避免银行方受到更大的损失。6.2 二级故障二级故障是比较严重的故障,要求在我方的第一发现人在10分钟内告知项目经理,在故障发生的30分钟以内联系到交付中心对应响应人员(交付中心总监)。在故障发生的30分钟内进行故障的现象及后果等的描述,之后交由领导统一指挥。在3个小时内对问题作出相应的处理方案,以最快速度组织人员到现场处理工作。要求项目经理、技术经理、硬件系统高级工程师、高级软件工程师在故障发生的12小时内

14、赶到现场。如人员无法到齐,可派同等级别人员替换。领导无法到场,可以 指挥。问题如果在两个小时内没有明确结果,故障直接升级为一级。二级故障要在48小时之内解决,避免银行方受到更大的损失。6.3 三级故障三级故障是严重的故障,要求在我方的第一发现人在15分钟内告知项目经理,在故障发生的60分钟以内联系到交付中心对应响应人员(项目经理)。在故障发生的60分钟内进行故障的现象及后果等的描述,之后交由领导统一指挥。在6个小时内对问题作出相应的处理方案,确定问题是否需要到现场解决。如果需要去现场则组织人员去现场,不需要的话就在公司内部解决。要求项目经理、技术经理、硬件系统高级工程师、高级软件工程师在故障发

15、生的下一工作日内赶到现场。如人员无法到齐,可派同等级别人员替换。项目经理如果无法到场,可以 指挥。问题如果在四个小时内没有明确结果,故障直接升级为二级。三级故障要在72小时之内解决,避免银行方受到更大的损失。6.4 四级故障四级故障是一般的故障,要求在我方的第一发现人在30分钟内告知项目经理,在故障发生的90分钟以内联系到交付中心对应响应人员(项目组长)。在故障发生的90分钟内进行故障的现象及后果等的描述,之后交由领导统一指挥。在12个小时内对问题作出相应的处理方案,判断四级故障是否需要现场处理。并查找是否还存在类似问题,一并在本次的处理方案中解决。项目经理如果无法到场,可以 指挥。四级故障要

16、在120小时之内解决,避免银行方受到更大的损失。7 事后总结程序在试运行或者运维阶段,经常会出现意想不到的问题,这些问题在有经验的人手中可能很快就会解决,我们不能避免风险的产生,但是我们能尽量将有害风险的影响降到最低。这样我们就需要提高个人的技能水平,对出现的问题多做分享,多学习。故障总结由项目经理进行整理,并填写故障总结单,填写后在项目文档中备案,同时给其他项目组的项目人员转发,避免类似事件发生。8 附件1 故障总结单 单号:项目名称项目经理项目描述故障部分(由项目经理填写)故障等级一级故障 二级故障 三级故障 四级故障故障后果故障原因故障总结类似项目应注意 (有解决人员填写) 故障解决人:

17、填写人: 填写时间:古今名言敏而好学,不耻下问孔子业精于勤,荒于嬉;行成于思,毁于随韩愈兴于诗,立于礼,成于乐孔子己所不欲,勿施于人孔子读书破万卷,下笔如有神杜甫读书有三到,谓心到,眼到,口到朱熹立身以立学为先,立学以读书为本欧阳修读万卷书,行万里路刘彝黑发不知勤学早,白首方悔读书迟颜真卿书卷多情似故人,晨昏忧乐每相亲于谦书犹药也,善读之可以医愚刘向莫等闲,白了少年头,空悲切岳飞发奋识遍天下字,立志读尽人间书苏轼鸟欲高飞先振翅,人求上进先读书李苦禅立志宜思真品格,读书须尽苦功夫阮元非淡泊无以明志,非宁静无以致远诸葛亮熟读唐诗三百首,不会作诗也会吟孙洙唐诗三百首序书到用时方恨少,事非经过不知难陆游问渠那得清如许,为有源头活水来朱熹旧书不厌百回读,熟读精思子自知苏轼书痴者文必工,艺痴者技必良蒲松龄 声明访问者可将本资料提供的内容用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本文档及相关权利人的合法权利。谢谢合作!

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高考资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁