《最新netapp设备用户日常维护手册要点.doc》由会员分享,可在线阅读,更多相关《最新netapp设备用户日常维护手册要点.doc(26页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、Netapp 存储日常维护手册GTI PROFESSIONAL SERVICESNETAPP 存储日常维护手册TT用户名称:TT目 录1.0目标_32.0设备硬件说明_43.0 指示灯说明_ 64.0 设备管理_115.0 巡检及巡检方法_176.0 设备故障应急预案 _181.0 目标NetApp 解决方案能够助客户有效地简化运作,同时最大限度地降低风险,为那些不断经历变化的企业提供更高的性能和可扩展性。借助于产品、技术和合作伙伴的良好组合,NetApp 解决方案有助于解决最为迫切的 IT 和业务问题,同时最大限度地提高投资回报率。 本指南是为使用NetApp存储系统的维护人员编写的基本管理
2、知识,目标是指导维护人员如何进行每天的健康检查。详细的存储系统和命令管理参见随机手册。 在线帮助2.0 设备硬件说明2.1 FAS3140硬件视图前视图 控制器控制器电源电源后视图2.2 disk shelf DS14mk4视图前视图后视图ESH4模块AESH4模块B电源电源3.0 指示灯说明3.1 controller 指示灯指示灯说明(Power) (fault) (controller A) (controller B) Fault LED故障灯无故出现为橘色时请查看系统日志信息,联系服务技术支持GTI3.2 DISK SHELF指示灯说明3.3 ESH4模块指示灯说明3.4 电源指示灯
3、说明(指示描述信息见ESH4模块卡片)3.5 disk 指示灯说明4.0 设备管理 4.1 Filerview 图形管理接口 Filerview是 NetApp提供的图形管理接口,可以方便地实现对 NetApp的存储设备的管理。启动浏览器访问 IP地址na_admin。 你需要: 使用 Microsoft IE或 Netscape Navigator (version 4以上) URL: http:/filername/na_admin 如果有错误,可能和你的DNS有关,你可以用:http:/ip_address_of filer/na_admin,然后点击Filerview进入管理界面,通过
4、filerview你可以完成几乎所有的管理任务点击 FILER VIEW图标进入 FILER VIEW管理界面,输入用户名和密码可以完成存储设备、卷、设备、网络、安全、LUN、NDMP、SNMP、SnapMirror等配置。以下为常用菜单功能说明:分类操作实施路径备注基本管理显示序列号和版本信息Filer-Show Status检查软件许可Filer-Manage Licence系统状态报告Filer-Report检查日志信息Filer-Syslog Messages命令行接口Filer-Use Command Line配置自动邮件通知:发件人、邮件服务器等Filer-Configure Au
5、tosupport设置日期和时间Filer-Set Data/Time设置时区Filer-Set Timezone关机和重启动Filer-Shut Down and Reboot系统实时状态Filer-Show System Status磁盘和空间管理磁盘管理Storage-Disks- Manage适配器信息Storage-Adapters-Report建立 AggrAggregate-Add管理 AggrAggregate-Manage建立 VolVolume-Add在aggr建立后管理 VolVolume-Manage增加限额管理Volume-Quota-Add快照管理Volume-sn
6、apshotAdd Volume-snapshotconfigure开启和关闭块访问协议LUNs-Enable/Disable建立 LUNLUNs-Wizard增加主机 WWNLUNs-initiator group-AddiSCSI安全模式LUNs- iSCSI- initiatorsecurityiSNS服务LUNs- iSCSI- iSNS网络管理管理网络端口Network- Manage Interface网络基本参数Network- Configure增加虚端口:可以为Multi或 SingleNetwork- Add virtual Interface管理 host文件Networ
7、k-Manage Host Files管理网络组Network-Manage Net Groups配置 DNS和 NIS服务Network-Manage DNS &NIS Name Service协议访问配置 NFS输出向导NFS-Add ExportNFS基本配置NFS- ConfigureCIFS配置向导CIFS- Configure- Setup WizardCIFS配置参数CIFS- Configure- Setup Wizard个人主目录CIFS- Configure-Homedir增加共享目录CIFS-Shares- Add管理共享目录CIFS-Shares- manage开启和关
8、闭 CIFS服务CIFS-Shares-Enable/Disable测试域控制器连接正常CIFS- Test Domain Controller审计配置CIFS- Auditing - ConfigureCIFS连接的进程CIFS- Session Report安全管理安全属性配置Security- Configure修改用户口令Network- C行 Password管理 Rsh远程访问授权Security- Manage Rsh Access4.2 命令行(CLI) 你可以用 CONSOLE口 (将 PC机的串口与 NetApp随机带的 console线连在 filer的CONSOLE口,
9、 打开 windows里的 hyperterminal或其它仿真终端,波特率设置为default: 9600波特率, 8位,无校验,1位停止位)和 telnet 登入 filer的命令行窗口.输入?或者 help可以看到全部命令? halt nfs snapvault aggr help nfsstat snmp arp hostname nis softwareackup httpstat options source cf ifconfig orouted stats cifs ifstat partner storage config igroup passwd sysconfig.命令
10、的详细使用方法可以通过 help得到,例如: help vol display or change characteristics of volumes The following commands are available; for more information type help vol add destroy online size clone lang options split container media_scrub rename status copy mirror restrict verify create offline scrub5.0 巡检及巡检方法 5.1 目
11、测 现场首先进行指示灯和 LCD 面板检查,判断是否有异常情况发生。5.2 硬件状态检查sysconfig r 检查磁盘情况正常情况: 发现所有磁盘,每个机头都有一个或多个 spare disk。非正常情况: 任何一个机头没有一个 spare disk,或有failed disksysconfig v 检查所有硬件 以上显示结果应该没有failed,error,warning等字样.5.3 检查网络是否正常使用 ping 存储设备 IP 地址,输入:ping FILERNAMEIP正常情况: 有相应,无丢包。 非正常情况: ping不通或者丢包严重。ifconfig a 主要网口状态应为upv
12、if status VIF所有端口是否正常5.4 检查 Cluster 状态是否正常cf status正常情况: 2个节点状态应该为enable非正常情况: 任何一个机头显示非如上所示,就属于非正常情况5.5 检查卷容量是否正常使用 df检查空间使用状况。正常情况: capacity 低于或等于 90%。非正常情况: capacity 高于 90%。5.6 性能检查 sysstat x 1 CPU利用率应该在80%以下5.7 日志文件检查rdfile /etc/messages仔细检查是否有failed,error,warning等字样. 如有,则记录下来5.8 收集 autosupport
13、信息Options autosupport.doit 触发最新autosupport信息5.9如获得更多可信息请访问 6.0附件:存储设备紧急情况应急预案6.1 存储问题定位于排查 6.1.1物理检测 (Power) (fault) (controller A) (controller B) Fault LED故障灯无故出现为橘色时请查看系统日志信息,联系服务技术支持GTI 6.1.2 FilerVIew检测 打开IE窗口输入http:/ip_address_of filer/na_admin,然后点击Filerview进入管理界面其中: Filer 显示设备名 Model 显示设备型号 Sy
14、stemID 设备的ID号码(不是SN) Version 显示设备使用系统的版本 Volumes 显示设备的卷信息,如有问题会有报错 Aggregates 显示设备AGGR信息,如有问题会有报错 Disks 显示设备磁盘使用情况,如有磁盘损坏,会有报错 Status 绿色代表正常 橙色代表有错误发生红色系统有紧急事件,或可导致紧急事件的隐患,并能显示相应的报错部件的信息 6.2错误定位步骤 首先通过设备的物理状态,和网页显示情况可以初步诊断是否是由硬件问题引起 例如:若磁盘随坏会有如下症状 1:存储系统的面板上会有橙色的灯亮起 2:仔细查看磁盘的扩展柜能发现损坏的磁盘上会有橙色的灯亮起 3:从
15、WEB的管理界面上看见橙色的灯亮起,并在DISK的后面显示是具体那块磁盘出现问题6.3 信息收集6.3.1通过WEB界面来抓取messages 进入WEB管理界面,选择Filer 点击syslog messages 即可看见系统的log信息,有助于我们错误的排查和诊断6.3.2在系统命令行中执行:rdfile /etc/messages 查看messages信息例如: raid.config.filesystem.disk.failed:error: File system Disk /aggr0/plex0/rg2/2a.28 Shelf 1 Bay 12 NETAPP X274_S10K7
16、146F10 NA01 S/N 3KS08XSN000075290G9C failed. aggr status r 查看raid组信息,会看到failed的disk例如:Broken disksRAID DiskDeviceHA SHELF BAY CHAN Pool Type RPM Used (MB/blks) Phys (MB/blks)- - - - - - -failed 2a.28 2a 1 12 FC:A - FCAL 10000 136000/278528000 137104/2807901846.3.3收集autosupport信息Options autosupport.d
17、oit 触发最新autosupport信息或使用命令 rdfile /etc/log/autosupport/201001020437.0并使用log记录的功能手动记录设备的全部信息。6.4 信息提交6.4.1 autosupport设置通过对autosupport的功能进行设置能对系统的安全进行全面的保护 需要设置 mailhost 和 发邮件报告发送和接收人以及发送方式1:每周会产生设备的周报(weekly report),统计设备运行状态2:在设备运行情况发生问题是,例如硬件损坏,或软件告警等消息时会及时出发autosupport给收件人3:若有备件损坏时,会第一时间发送给收件人和net
18、app技术中心,会自动生成备件,并主动与用户联系,第一时间发送出备件。6.4.2 GTI技术支持我们建议在设备的autosupport的接受人里面添加GTI的存储技术团队邮件,当问题发生时,我们会第一时间得到消息,会主动与您联系,第一时间为您排查和解决问题6.4.3 NETAPP800技术支持中心NETAPP的全球技术支持中心电话请010-10-8007131160,语言选择请按1#中文服务,选择3#新CASE建立,填写SN号#进入语音服务每天早8点至晚8点,由大连的中文技术支持,其余时间由国外技术支持,24*7小时保障您的安全。 示例 磁盘更换步骤1、关于磁盘所有权的概念介绍 磁盘所有权:在
19、存储系统中每个磁盘必须被分派到一个控制器系统中,每个磁盘也要分派到一个池中(让单机或集群中一个机头所识别到磁盘) 基于硬件的所有权:磁盘所有权是机头HBA卡和shelfHBA卡的连接位置决定的,插入新盘时系统会自动识别磁盘,使其成为一个热备盘加入到POOL0中(在SYNCMIRROR没有开启时候)。 基于软件的所有权:磁盘所有权是管理员决定的(可以利用命令管理),HBA卡插槽位置将不影响磁盘所有权。当添加磁盘时候需要分派所有权,否则系统不能马上识别新盘Netapp filer系列对磁盘所有权的支持如下:存储系列 硬所有权软所有权FAS2050支持FAS3020 FAS3050支持支持FAS31
20、40 支持FAS3070支持FAS6000支持Shelf ID 可以在后面改变2、磁盘ID,BAY,shelf ID概念Drive bay 013以DSMK2 ATFC /-FCX为例子:Shelf ID 为1的shelf 第一个BAY(0)的磁盘ID为16,如果连接到控制器的0a口,则磁盘ID为0a.16.其他磁盘以此类推定位计算公式shelf ID 16 + BAY =磁盘ID 一、 更换原因:磁盘更换原因会有很多种可能,以下列出了一些常见的问题和错误的messages:1. 磁盘failed,被放进Broken pool 中 aggr status fBroken disksRAID D
21、isk Device HA SHELF BAY CHAN Pool Type RPM Used (MB/blks) Phys (MB/blks)- - - - - - - - -failed 5a.50 5a 3 2 FC:B - ATA 7200 635555/1301618176 635858/1302238304rdfile /etc/messages raid.disk.inserted:info: Disk 5a.50 Shelf 3 Bay 2 NETAPP X268_SGLXY750SSX AQJZ S/N 5QD290M8 has been inserted into the
22、system2.disk bypass 错误,messages中没有错误信息sysconfig a Shelf 1: ESH2 Firmware rev. ESH A: 14 ESH B: 14Disk 4b.21 in Shelf: 1 Bay 5 is bypassed物理上,failed磁盘前面的LED2指示灯为常亮橘灯状态 三、更换造作之前确定磁盘的位置的方法1. 首先在系统中确认,利用命令sysconfig r 或者 aggr status r (查看raid组中所有磁盘的状态,其中会包括failed磁盘的磁盘ID)以此来定位磁盘的位置如:RAID DiskDeviceHA SHEL
23、F BAY CHAN Pool Type RPM Used (MB/blks) Phys (MB/blks) - - - - - - - fialed 0a.170a 2 8 FC:A - FCAL 10000 272000/557056000 274845/5628842962.物理上查看 0a 为 路径ID :为连接机头0a口的LOOP 的shelf定位出shelf1 第2个磁盘0a.17 failed 四、 操作步骤:1 确认failed磁盘,热备磁盘,以及当前没有RAID重建操作aggr status rrdfile /etc/messages确认磁盘的failed在Broken池中2
24、 根据查找出的磁盘ID,进行磁盘位置的定位3 拔出定位的损坏磁盘 之后步骤随时查看CLI即时弹出的messages信息4 之后插入新的RMA磁盘5 如果是 hardware ownership 则磁盘插入会立即成为热备磁盘如果是 software ownership则磁盘插入需要指派 ,看options 选项options disk.auto_assign 设置为开启的,磁盘会自动被本地的连接的机头加入到热备磁盘中设置为关闭需要手工指派:disk show n (查看插入的没有所有权指派的磁盘)disk assign 磁盘ID (加入到本地的机头)6 验证磁盘状态aggr status r (
25、确认磁盘已经指派到热备磁盘池中,Broken池为空,RAID组状态正常)7 如果是多路连接可以通过一下命令验证是否多路看到更换磁盘sysconfig a | -v8 整个过程需要记录LOG信息五、 操作过程中的以外处理:在更换磁盘过程中可能会有一些意外情况,情按下步骤操作1 如果插入新的磁盘提示报错,不能识别或者识别错误的信息执行aggr status r (保证RAID组状态正常,并查看插入出错的磁盘当前的状态)如果当前RAID组状态正常,取下磁盘2 联系GTI存储的支持工程师,进行进行进一步支持Global Technology Integrator Limited Page 26 of 26