《EMCCX300硬盘、电池更换方案.docx》由会员分享,可在线阅读,更多相关《EMCCX300硬盘、电池更换方案.docx(11页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、EMC CX300硬盘、电池更换方案2013年6月3日北京凯文斯科技发展有限公司文档控制:日期作者版本修改记录2013-06-03王 赛V1.0审 核:姓名职位屈宪法技术经理分发:拷贝No.姓名单位部门服 务 方: 北京凯文斯科技发展有限公司 实 施 人: 王 赛技术审核: 屈宪法 Beijing KVS Science & Tech Development Co. Ltd Wanquanhe Road, Haidian District, Beijing Zijin Building 68, Room 1709 网址: 邮编:100086目 录一、故障简介4二、技术方案41、更换前准备42、
2、对系统的影响43、注意事项54、回退和保障方案55、实施计划56、方案实施细节71)、健康检查72)、一般性的状态健康检查73)、SP的健康性检查74)、连接性的健康性检查85)、LUN的健康性检查86)、建议停止需要更换备件的存储服务器当前节点服务进程87、更换故障硬盘方法88、更换SPS电池方法99、更换SPS时注意的事项:10一、故障简介北京铁路局EMC CX300存储一块硬盘、一块SPS电池出现故障;处于失效状态,需要更换;故障分别出现在两台存储中,硬盘故障的存储控制器IP地址为10.13.4.137/10.13.4.138;SPS电池出现故障的存储控制器IP地址为10.13.4.13
3、9/10.13.4.140;为保证数据安全,本文档为此次更换硬盘及SPS电池操作提供一个指导性的方案。二、技术方案1、更换前准备1)、检查存储系统运行正常2)、确认能够通过管理口来管理CX300。3)、检查主机系统状态正常。 4)、检查EMC CX300除已知故障外,没有其他异常。5)、检查数据备份正常。6)、建议停止需要更换备件的存储服务器当前节点服务进程(处于安全考虑)2、对系统的影响在更换EMC CX300故障件的过程中,出于应用的安全考虑,建议在业务不忙的的情况下进行,硬件更换时间约为2小时;更换完成后通过管理控制台确认原故障信息消除且存储运行状态正常,服务进程正常启动,即可视为更换备
4、件工作完成3、注意事项建议在更换前备份数据,并确保备份数据的有效性。4、回退和保障方案如果发现更换后的备件依然没有解决故障,原故障信息任然存在,需将保持当前状态,不要再换回,另行申请新的备件。5、实施计划序号操作时间操作内容执行人员需要的配合备注一检查步骤1检查备件是否正确、完好。诺西工程师,凯文斯工程师等2对EMC系统进行一次全面检查。确认除已发现故障外没有其他新发故障。(如存在其他的故障应先行修复)凯文斯工程师提供存储IP、帐号、口令等相关便利条件二实施步骤1建议停止需要更换备件的存储服务器当前节点服务进程诺西工程师2更换硬盘(一个小时左右)凯文斯工程师 3更换SPS(40分钟左右)凯文斯
5、工程师4检查更换后状态,SPS显示T状态为正常凯文斯工程师5电池换完后,可以重新enable write catch, 提高应用的性能凯文斯工程师 6更换完毕后观察存储30分钟的(刚更换完毕可能还告警,那是电池在充电,等一会就会消除)。 凯文斯工程师7硬件更换成功后,观察无问题后,即可启动更换前停止的服务进程诺西工程师三回退步骤1如果发现更换后,状态依然是F,报警灯长亮,保持当前状态;如果没有其他报错,立即申请新备件诺西工程师,凯文斯工程师6、方案实施细节1)、健康检查登录SP IP,输入用户名和密码(admin/password),点击物理设备,对EMC系统进行一次全面检查。确认除已发现故障
6、外,没有其他新发故障。(如有其他故障,应先行处理)2)、一般性的状态健康检查登陆Navisphere , 右击点“Array”, 并选中“Update Now”, 将存储状态刷新一下,右击点“array”, 并选中“Fault” ,这将展现一个Array中发生fault的组件列表。3)、SP的健康性检查右击SPA/SPB,并点击“Properties ”, 确定当前的状态为present, 并且 the peer boot state shows Done. Normal. Storage System Software running. Ready for I/O. 确定读写cache的状态
7、。4)、连接性的健康性检查选择“Array”, 右击, 并且选择 Connectivity Status,检查主机向盘阵的注册情况。5)、LUN的健康性检查选择lun, 右击“Properties”;,检查Lun 的读写cache 是否enable。 6)、建议停止需要更换备件的存储服务器当前节点服务进程执行手工停止当前存储服务器所在节点的服务器进程,其他节点服务器可以独立处理业务,不受任何影响。停止步骤如下:(1)、检查当期节点及其他节点的服务进程是否正常(2)、手工停止当前节点的数据备份(3)、停止当前节点的服务进程 7、更换故障硬盘方法EMC CX存储一般在二种情况下需要换盘,一为硬盘已
8、经损坏(亮黄灯),二为频繁报DIsk soft media error错误,第一种情况很简单,直接去现场热拔插换硬盘即可,第二种情况其实硬盘还没有硬件损坏,指示灯仍正常,这种情况换硬盘需要多点步骤,下面是实际更换过程的记录:1)、找到相应需要更换的硬盘(存储-hysical-Bus x Enclosure x-Disks),然后右键执行copy to hot Spare,即把需要更换硬盘上的数据copy到hotspare盘上下载 (33.24 KB)122011-3-25 11:10 2)、在执行第一步操作后,存储的图标会变成带一个“T”,这表示数据正在copy,还不能换盘,需继续等待,大概需
9、要30分钟 3)、等到存储的图标从“T”变为“F”后,需要更换的硬盘指示灯变为桔黄色,这表示已经可以拔出这块坏盘了 4)、拔出坏盘,换入新盘,注意比较一下两块块盘的型号是否一致,如转数,接口,容量5)、换入新盘后,硬盘指示灯变为绿色,并快速闪烁,表示存储已经在重建数据,把数据从HotSpare盘上恢复到这块新盘上 6)、从存储的console页面上也能看到,存储的图标又变为“T”,大约30分钟后,重建完成,图标T消失,恢复正常8、更换SPS电池方法1)、关闭SPS A/SPS B电池开关, 等待最长90秒钟关闭SPS2)、卸下前后固定螺丝,拔下输入线,输出线和侦测线,拔出电源和电池3)、插入新
10、电源和电池,依次插入输出线,侦测线和输入线,打开电源开关4)、电池处于同步状况,并不断闪烁,直至绿色等常亮5)、等待20分钟完成SPS的自检和充电,充电状态下指示灯会闪烁,完全充电完毕将会一直亮绿灯6)、登录navisphere查看状态7)、如果SPS在替换后依然显示错误,进一步检查sense cable.9、更换SPS时注意的事项:* 确认Navisphere Manager 里面的 write cache 是不是disable . * 更换好之后要确认write cache enabled 1)、关闭故障SPS上的开关,不要拔线,此时即断掉了其中一路电源供应,SPS的状态灯会灭掉,另一个S
11、PS电池的ON-BATTERY LED亮起,等待大概几十秒后,另一个SPS的ON-BATTERY LED 灭掉,ACTIVE LED开始慢闪。2)、此时才能开始拔线(顺序:AC-IN,AC-OUT,连接控制器的INTERFACE)。3)、从设备后面,卸下4个固定螺丝,从设备前面,拆开挡板,卸下6个固定螺丝,卸下故障SPS。4)、装上新的SPS。注意要保证新SPS上的开关是在0位置,即关闭的。5)、接好电源线后(顺序:连接控制器的INTERFACE,AC-OUT,AC-IN)。6)、打开更换的SPS的开关。北京铁路局EMC CX300电源线连接图7)、重新打开Write Cache8)、登陆Navisphere,右击“ARRAY”, 择“属性”,选择“cache” tab, 勾上Write cache 框,然后点 “ OK” , 9)、检查状态,登录SP IP,检查SPS状态是否正常10)、硬件更换成功后,手工起动被停止的节点的服务及相关进程11)、确认没有告警输出,更换工作即可视为完成11