《最全系统运维(公司IT的管理)工作规范.docx》由会员分享,可在线阅读,更多相关《最全系统运维(公司IT的管理)工作规范.docx(17页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、XXXXXXXX有限公司工作规范目录一、系统运维管理的维护职责二、系统运维管理职责的划分1、 系统管理员职责2、 系统工程师职责三、系统运维管理具体工作内容1、 资产统计管理2、 网络、安全系统运维管理3、 主机、存储系统运维管理4、 应用服务系统运维管理5、 数据系统运维管理6、 信息保密管理7、 日常运维在日常工作中要定期对系统进行优化,检查系统补丁安装情况,查看防毒系 统的病毒库升级状态,关闭无用的系统组件和系统服务,检查并修复服务系统错 误日志,管理账户密码及用户权限,应用服务配置修改和参数更新,数据系统性 能维护,监控备份服务,保障应用服务系统随着公司业务的增涨和改变做出相应 的服务
2、更新,并负责网络传输设备的安装、调试、测试,排除网络故障,优化网 络性能,预防网络隐患,保障网络畅通稳定的运行。维护工作站浮现操作系统、办公软件、软件客户端、病毒入侵、数据误删除、 漏洞补丁缺失、网络通断、常见硬件错误等故障现象;打印机、扫描仪、传真机、 数码存储产品等浮现驱动程序错误、不能打印、扫描、收发传真、数据存储错误、 共享错误等影响正常工作的软件故障,最大程度的提供技术支持工作,以保障公 司业务的顺利进行。附表:机房巡检表机房巡检表检查时向年 月 日检查人一、机房环境检查项结论情况摘要检查项结论情况摘要温度正常口异常湿度正常口异常痕迹正常口异常清洁正常异常异响口有口无异味有口无注;痕
3、迹脸查地面、墙壁、天花是否有痕迹、水渍,机房内是否有鼠患、蚊、婶螂痕迹,正常室温:20、25c二、周边设备检查项结论情况摘要检查项结论情况摘要UPS正常口异常电池组正常口异常空调正常口异常消防正常口异常三、电话交换机,网络设备检查项结论情况摘要电话交换机外线电话正常通话正常口异常内线电话正常通话口正常口异常电话交换机正常工作正常口异常网络设备防火墙网络通讯状况正常口异常网络流量大于0%小于2.5%正常口异常网络交换机数据指示灯状况正常口异常网络通讯状况正常口异常交换机端口及网线状况正常口异常四、服务器检查项提示操作/正常值结论情况摘要备注整体检查硬件故障查看服务器设备故障灯正常口异常故障处理详
4、情补丁是否有新补丁需要测试安装是口否补丁安装详情防病毒病毒库是否升级为最新是否病毒库日期XXX服务系统事件无错误事件与不明登陆事件正常 口异常日志文件设置以及运行正常,数据量正常正常 口异常磁盘卷组无处于失效状态的逻辑卷正常 口异常功能服务器平台正常访问正常 口异常远程登陆正常工作正常 口异常数据备份最近备份时间:年 月 日XXX服务器系统事件无错误事件与不明登陆事件正常 口异常日志文件设置以及运行正常,数据量正常正常 口异常磁盘卷组无处于失效状态的逻辑卷正常 口异常功能服务器运行情况正常口异常远程登陆正常工作正常 口异常服务办公系统正常启动正常 口异常数据备份最近备份时间:年 月 日XXX系
5、统事件无错误事件与不明登陆事件正常 口异常日志文件设置以及运行正常,数据量正常正常 口异常磁盘卷组无处于失效状态的逻辑卷正常 口异常功能远程登陆正常工作正常 口异常服务器运行情况正常 口异常数据库正常工作正常 口异常数据备份最近备份时间:年 月日XXX服 务系统事件无错误事件与不明登陆事件正常 口异常日志文件设置以及运行正常,数据量正常正常 口异常磁盘卷组无处于失效状态的逻辑卷正常 口异常功能远程登陆正常工作正常 口异常服务器运行情况口正常二异常数据库正常工作正常口异常数据备份最近备份时间:年 月日重要参数维护记录表参数维护发起人姓名事件发起日期事件发起单位/部门联系电话维护人员姓名工作日期维
6、护人员单位/部门联系电话参数修改事由管理部门领导审批意见维护人员具体操作新参数实施测试结果备注:非机房维护人员进入申请表申请人员姓名进入时间进入人员单位名联系电话进入事由陪同人员姓名陪同人员部门备注:外来维护登记表维护人员姓名工作日期维护人员单位联系电话系统当前状态维护对象系统问题来源问题描述解决方法及说明系统运维人员审核意见备注:赠送以下资料管理的实践读后感德鲁克说:“管理就是界定企业的使命,并激励和组织 人力资源去实现这个使命。界定使命是企业家的任务,而激 励与组织人力资源是领导力的范畴,二者的结合就是管理。” 提出了三个经典的问题:我们的事业是什么?我们的事业将 是什么?我们的事业究竟应
7、该是什么?这三个问题经过改 编彻底可以应用于现在的我们:我们学习的是什么?我们学 习的将是什么?我们学习的究竟应该是什么?经典之所以被称之为经典往往在于其超强的预见性.多 年之后依然闪耀者夺目的思想光辉,熠熠发光,为处在黑暗 中的人们知音了前进的方向与道路。大师之所以成为大师在 于思想的高度,作品能够让人们产生心灵上的共鸣,大事记 是肉身已逝,但精神依然长存.德鲁克先生管理的实践已面世半个多世纪了,在这 五十多年中,有关企业管理方面的书籍可以用浩如烟海来形 容。但能禁得住时间考验的的书籍还是管理的实践一书, 这也从另一个侧面证明了管理的实践是一本值得认真阅 读的好书。终于读完了德鲁克的管理的实
8、践,宛然自己游荡在 上个世纪中期的企业中。这本书构筑了完整的“对人的管理” 思想。如:1、人是资源,是所有资源中最富潜力的资源。 德鲁克认为“人的资源一一整个的人,是自然赋予的所有资 源中最丰富、最有才干,最有潜力的资源。”这是因为在企 业可以得到的所有资源中,认识“惟一能够增长和发展的资一、 系统运维管理职能运维管理人员具体承担全公司网络系统的设计、规划、建设和管理。网络管 理人员的主要职责有:1 .根据网络运维特点和运维需求,拟定公司网络运维管理的方针、政策、 保障计划等提供决策,并组织实施;2 .承担网络执勤、监控工作,掌握网络运行状况,及时处理网络故障;3 .掌控网络的各项资源,如IP
9、地址、域名分配等;4 .定期分析讨论网络运行状态与运行质量,对照各项参数,排除潜在故障 隐患,提出网络改进意见;5 .保障公司网络系统的正常运行,并提供网络应用的技术支持;6 .对服务器数据及其他重要数据的备份管理;7 .公司网络技术文档资料的管理;8 .采集和反映公司网络使用人员的意见和建议,完善网络功能、改进网络 性能,为全公司人员提供满意的服务。二、 系统运维管理职责的划分运维管理保障人员包括:系统管理员、系统工程师。1、系统管理员职责:1)组织制定公司网络运维的方针政策、管理制度,并组织各部门积极落实:2)完成公司网络运维的日常行政管理工作,负责检查、催促、考核系统执 勤情况;3)组织
10、技术力量,及时、准确地处置网络发生的故障;源”,亦即“人要贡献出什么必须由他自己决定”,只要他们 愿意进行“有目标的、集中和联合的努力”,就可以“产生 出真正完整的东西来”。2、必须对人进行管理,挖掘出人的 潜力。德鲁克明确的提出“利润并非企业活动的目的,利润 不应该成为企业决策的理由、原因和依据,他只是对企业是 否起作用的一种测验”,他说道:“企业需要最大限度地发 挥 人的能力。”因此,“经理人员的首要任务是把他的资源 首先是人的资源中蕴含的力量都挖掘和发挥出来。那末我 认 为,真正诠释管理的意义就要将人的机能发挥的淋漓尽致。 人是社会的主体,是社会发展的主要动力。” 3、是工作富有 活力,
11、并使职工有成就感。管理者如果只注重员工的绩效, 那就死定了!那是传统的管理方式,现代管理方式已是人 性 化管理,更多的是注重员工的感受。同样的工作,在行政的 约束下与在自动自发的工作结果虽然是都完成任务了,但 完 成的综合效果彻底不同。只注重绩效的话,那会留不住优秀 人材。因此,要想将公司管理的有声有色,必须关注职工的 感受,时常与他们交流,了解他们的想法,使他们在工作中 能够感受到自己的重耍性。管理的实践一书,系统的论述了企业的核心问题, 即企业的目的:惟独一个正确而有效的定义一创造顾客;两 个基本职能一营销和创新。企业存在的目的不能从自身寻觅, 只能从外部,从对社会的贡献中寻觅,从客户那里
12、寻觅。企 业通过不断的创新满足顾客的需求。管理本质上是一种实践, 而不是一种专业和科学,其本质不在于“知”而在于“行”。 任何热中于将管理科学化和专业化的尝试,试图消除所有的 波动,风险和不可知的措施也就是在消除自由,创新和成长。 管理本质上是一句目标业绩和责任进行的管理。检验管理和 创新的成果,不是知识,而是业绩和成就。管理者和员工在 本质上没有差别,惟独责任上的差别。员工的权利不是来自 于管理者的授权,而是来自于所承担的责任。区分高层管理 者和基层管理者的惟一维度在于时间。正确的定位个人与组织的关系,组织要求员工要主动积 极,以企业的目标为努力的方向,同时要求员工要自愿接受 改变。但员工对
13、组织的要企业普通较为弱势,德鲁克总结为, 首先员工是一个人,通过职位建立地位,希翼公平做事故意 义;其次,员工要求企业建立标准,对员工良好业绩的关注。 “组织需要个人为其做出贡献,个人需要把组织当成实现自 己目标的工具。”因此管理者的重要任务是将员工的目标引 向组织目标。管理者需要在现在和未来间取得平衡。管理是 一种稀缺的资源。一本优秀的著作哇不尽的宝藏,可以陪伴人的平生。有 所得在于能够更加深刻的领悟思想的内涵与外延,在于发现 自己的误解与错误,在于能够明确自己未来道路的方向!4)检查系统运维工作,定期(或者不定期)讲评运维人员业务工作情况,安排网络管理的相关工作。2、系统工程师职责:1)掌
14、握我公司网络总体性能指标,系统拓扑结构、设备连接关系、信息流 程以及各系统设备功能和工作状态;2)熟练掌握系统设备的硬件安装、线缆连接、系统设置;熟悉软件的安装、 测试、升级等管理工作;完成网络系统的资源调整、配置等任务;3)掌握系统常用故障的检测手段与排除方法,迅速准确定位故障部位,积 极和其他专业技术人员密切配合,排除系统故障;4)熟悉公司网络设备及系统定期维护方法和步骤,负责分管设备的安装调 试与维护工作;5)随时监控计算机病毒在公司网络上的流行,定期检查公司计算机病毒库 升级工作,做好计算机病毒的防范工作;6)掌握电工技术、配电设备组成及工作原理,熟悉电源设备的技术指标、 机房配电路线
15、及供电情况,定期检查设备路线的安全状况,确保人员及各项设施 的用电安全,提出合理的预防处理措施;7)掌握机房安装配置的空调机工作原理和空调系统技术性能指标。熟悉空 调系统设备的定期维护方法与步骤;在相关技术人员的配合下排除设备疑难故障; 保障设备稳定可靠运行;8)具备良好的工作作风和严谨的工作态度,服从管理,认真负责,坚守岗 位,浮现问题要镇静分析、沉着处理;9)提高自身素质,加强学习,努力钻研,采集整理技术资料,提高分析问题、解决问题的能力。三、系统运维管理工作内容1、 固定资产管理企业对固定资产的管理,主要体现在固定资产购置.、管理、使用、折旧、转 让等方面。部门主要负责实时记录固定资产变
16、动情况和定期统计本部门固定资产 使用使用并提交资产统计表。运维部固定资产包括三个部份:办公自动化设备、机房内部设备、库房资产。1)办公自动化设备使用人员不得擅自拆装更换设备,并且有妥善保管义务, 定期对设备进行维护、检查其使用情况。设备添加、更换、升级、和故障,使用 人员应及时更近资产统计表信息,并注明事由。2)机房设备应有固定人员进行维护管理,非工作人员未经许可不得进入。机房设备如浮现变更,要及时汇报给上级部门和相关部门,协同处理问题,尽快 的恢复正常运营。3)库房存储的资产应及时做好进出库记录,并定期对库房进行盘点核实库 房资产统计。附表:固定资产清单统计表资产编号资产名称使用情况使用人员
17、备注库房资产统计表资产编号资产名称入库时间入库签字出库时间出库签字备注2、 网络、安全系统运维管理1)网络系统的运维管理从三个方面实现:网络的连通性、网络的性能、网 络的监控管理。网络系统运维的前期准备,需要有整个网络拓扑图,机房网络拓扑图,核心 设备端口平面详图,接入设备端口平面详图,办公区域端口平面详图,并且需要 对网络设备、网络端口、连接路线做与拓扑和平面详图相对应的标示。前期准备 工作,可以做为公司的技术文档的一部份,也可以为公司运维管理带来更加准确 的网络基础依据。网络连通性需归纳到每天的主干网络日常巡检工作范畴内,连通性测试可以 确认网络平台的正常运作,并可以及时检查出网络的连通故
18、障,缩小问题浮现时 间差,根据的网络基础数据和测试得到的数据,更快更准确的确定网络的故障点, 排除故障,恢复网络的正常运行。工程师定期通过日常网络巡检,网络安全硬件日志,对网络问题、网络运行 状况进行周期性检查和数据分析后,总结出网络的性能。日常运维工作中,除去网络的连通性和网络性能的监测,还需要对终端使用 网络的情况有定的掌控,如服务器的日常访问量、网络数据传输峰值、工作用机 日常对网络的使用情况等。对网络负载能力、网络畅通性、网络运行瓶颈、网络常见问题根源等方面有 一定了解后,针对性的提出解决建议方案,提早预防发现的网络隐患,降低公司 运营风险,保隙网络的稳定运行。2)计算机网络安全运维可
19、分为物理安全和逻辑安全两方面。保护网络系统中相关设备(机房设备,日常工作设备)的物理保护,以免予 破坏、丢失等。机房设备应有固定人员进行维护管理,非工作人员未经许可不得 进入。机房日常巡检时要注意机房环境和周边设备的检查,如机房温度、机房适 度、有无异味异响、机房异常痕迹、UPS、空调、消防等,为机房设备提供良好 运作环境保障。F1常工作设备要严格按照公司相关固定资产管理规定方法进行使 用和管理。物理设备连接,以最小化连接原则,根据业务服务响应需求,将不必要的物 理网络连接去掉,必要时将不同的服务需求群体划分VLAN,细化防火墙访问控 制,减少服务端口数量,对端口加以控制,做好信息物理隔离,以
20、免内部信息有 不必要外泄。操作系统安装系统补丁软件和网络版杀毒软件,定期扫描系统漏洞,安装系 统补丁,定期检查病毒库更新情况和发布情况,杜绝病毒的感染、传播和发作, 提高系统的主动谨防能力。系统管理员要注意账户密码的强壮度,并避免 账户和密码的大众性和常规性,在创建系统用户时,要严格控制,对系统 进行多角色、多等级管理,浮现问题可方便确认责任人和问题根源。对系 统定期进行查看,关闭不必要的系统组件和应用服务,检查系统日志,检 测是否浮现异常。规划网络ip地址和MAC地址,限制连入局域网的上网计算机,对网络终 端连入状况有清晰的了解。对网络终端上网行为管理规则进行规划,规则添加如 屏蔽与工作无关
21、的网站、屏蔽某些关键词、监控p2P流量等,并将相关条款体 现在公司规章制度中,以加强管理力度。3、 主机、存储系统运维管理日常巡检要对硬件运行状态子细检查,从设备硬件提示信息及时发现问题, 防止影响扩大化,及时解决故障,恢复系统的正常运作和系统冗余性,外部提示 包括面板指示灯、电源指示灯、网卡指示灯、磁盘指示灯,以及各种硬件故障提 示和报警信息。定期监控cpu性能,内存使用情况,硬盘利用情况,硬盘运行状态,网卡状 态,系统日志,交换分区,进程状态,存储交换机端口状态,存储传输情况,通 过监控数据对主机和存储系统的性能进行评估。发现隐患,先将问题确定到点, 进行一段时间的问题信息数据监控,根据搜
22、集的更多更高密度的数据对问题原因 做出判断,如果属于普通应用系统问题,就将相应问题的应对工作加入工作日程, 及时排除系统隐患,如果是由于硬件瓶颈导致,就对相关数据做出整合报表并附 加解决提案提交公司上级,最终拟定解决方案,以确保服务系统的高可用性和高 冗余性。4、 应用服务系统运维管理应用服务系统是公司对外业务的信息平台,也是公司信息化能力的体现,同 时也承载了公司内部工作平台,所以平台的持续稳定运行显得十分主要。管理人 员要对不同应运服务的服务需求和服务人群有一定的了解,以便于规划网络构架, 划分网络资源,定位应运服务的性能。应运服务的运维管理,除了要结合机房硬件日常管理,还要对服务的配置信
23、 息进行维护管理。日常巡检是有条件的话要从不同的网域检测服务响应能力,并 要定期进入服务操作系统检查应用系统服务配置是否正常、检查日志文件是否有 异常报错、检查服务平台操作系统是否流畅。通过对配置信息、故障报错、服务 性能的管理,提高服务平台事件的分析处理能力。5、 数据系统运维管理数据系统承载了服务平台的数据功能,它的正常运行和应用服务系统是同等 重要的,数据系统运维主要体现在数据服务维护和数据备份两个主要方面。数据库运维服务管理包括主动数据性能管理,快速发现、诊断、解决性能问题, 在发现问题是,及时找出性能瓶颈,解决数据库性能问题,并要注意数据库系统 的变化,主动预防可能发生的问题,保证数
24、据访问响应能力。数据备份对服务冗余性有着重要的作用,对数据文件做好F1常数据增量备份 和定期全备份,对重要文件做光盘或者挪移存储等介质的数据备份,有条件的话 将数据进行异地数据备份。在日常工作中要监控备份服务进程、备份情况(起 止时间、是否成功、出错告警),浮现问题及时处理,恢复数据服务。当用户 业务数据需要更新时,要记录更新口期,以便故障发生后尽快恢复数据。备份应用系统数据的同时,也要对运维检修工作进行数据备份,如网络设备 配置参数备份、网管系统备份等,当在运维工作中浮现配置错误时,可以通过相 关备份恢复参数,短期内恢复网络系统正常运行。6、 信息保密管理运维人员有责任对网络、主机、系统软件
25、、应用软件等的密码、核心参数、 业务数据等涉及公司机密、运营管理、近期规划、发展规划的信息负有保密责任, 不得随意复制的传播。在进行日常运维工作时,未经上级或者相关部门批准,无 关人员不得进入机房,如已得到许可的,需由相关人员陪同。7、日常运维公司日常运维工作分两部份:日常巡检、日常维护。1)日常巡检主要体现在:机房环境巡检、设备巡检、网络传输巡检。机房环境n常检查可以通过机房监控服务器进行远程检查,但同时也要进行 人员现场检查和管理。机房应保持整洁并进行定期打扫,不许存放食物,禁止存 放杂物和私人用品,严禁存放易燃、易爆、具腐蚀性危(wei)险品。机房内设 备设施和物品不许任何人随意乱动,配
26、置的常用仪器仪表、工具、资料不得外借 带出机房。机房温度应控制在2025之间,湿度为401r60%,密闭防尘。 检查机房周 边设备,如UPS、空调、消防等设备的正常运行。机房出入应有登 记,非工作人员未经许可不得随意进入机房,得到许可方可进入,进入机房不 许喧哗、不许吸烟、不许用餐。机房内应配置事故照明装置.,以备应急使用。设备日常巡检包括:设备外观检查(硬件完好性、稳定性、告警系统、面板 参数标识);接续连线检查(接地线、电源引接线、架间连接电缆、负载连接电 路的接续可靠性等);机架内部简单清洁,接续端子除尘、加固等;设备内部软 件设置参数检查核对,历史告警信息阅读;设备运行资料核对记录;应用系统日 志;设备、线缆标识是否清晰、完整:应用系统磁盘空间、CPU占用情况;各 应用系统服务运行状态;数据备份是否正常进行。日常巡检还需要对网络传输设备运行进行状态和网络传输信息进行监控管 理。通过对网络设备的外部信息、运行日志、负载状态、配置参数、通信状况、 服务功能等信息确保设备正常工作,并实时监控网络计算机接入数量、终端用户 上网行为、网络端口传输流量等数据保证网络传输畅通,最终达到保障网络系统 正常运作的目的。7、 2)日常维护分为应用服务维护、网络维护、办公设备维护。