《计算机网络常见故障处理及维护方法.doc》由会员分享,可在线阅读,更多相关《计算机网络常见故障处理及维护方法.doc(9页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、计算机网络常见故障处理及维护方法随着计算机的广泛应用和网络的日趋流行,功能独立的多个计算机系统互联起来,互联形成日渐庞大的网络系统。计算机网络系统,就是利用通讯设备和线路将地理位置不同的、信息交换方式及网络操作系统等共享,包括硬件资源和软件资源的共享,因此,如何有效地做好本单位计算机网络的日常维护工作,确保其安全稳定地运行,这是网络运行维护人员的一项非常重要的工作。 在排除比较复杂网络的故障时,我们常常要从多种角度来测试和分析故障的现象,准确确定故障点。 一、分析模型和方法 (一)七层的网络结构分析模型方法 从网络的七层结构的定义和功能上逐一进行分析和排查,这是传统的而且最基础的分析和测试方法
2、。这里有自下而上和自上而下两种思路。自下而上是:从物理层的链路开始检测直到应用。自上而下是:从应用协议中捕捉数据包,分析数据包统计和流量统计信息,以获得有价值的资料。 (二)网络连接结构的分析方法 从网络的连接构成来看,大致可以分成客户端、网络链路、服务器端三个模块。1、客户端具备网络的七层结构,也会出现从硬件到软件、从驱动到应用程序、从设置错误到病毒等的故障问题。所以在分析和测试客户端的过程中要有大量的背景知识,有时电脑的发烧经验也会有所帮助。也可以在实际测试过程中询问客户端的用户,分析他们反映的问题是个性的还是共性的,这将有助于自己对客户端的进一步检测作出决定。2、来自网络链路的问题通常需
3、要网管、现场测试仪,甚至需要用协议分析仪来帮助确定问题的性质和原因。对于这方面的问题分析需要有坚实的网络知识和实践经验,有时实践经验会决定排除故障的时间。 3、在分析服务器端的情况时更需要有网络应用方面的丰富知识,要了解服务器的硬件性能及配置情况、系统性能及配置情况、网络应用及对服务器的影响情况。 (三)工具型分析方法工具型分析方法有强大的各种测试工具和软件,它们的自动分析能快速地给出网络的各种参数甚至是故障的分析结果,这对解决常见网络故障非常有效。 (四)综合及经验型分析方法综合及经验型分析方法是靠时间、错误和成功经验的积累,在大多数的网络维护工作人员的工作中是采用这个方法的,再依靠网管和测
4、试工具迅速定位网络的故障。 二、计算机无法上网故障排除 1、对于某台联网计算机上不了网的故障,首先要分别确定此计算机的网卡安装是否正确,是否存在硬件故障,网络配置是否正确在实际工作中我们一般采用Ping本机的回送地址(127.0.0.1)来判断网卡硬件安装和TCP/IP协议的正确性。 如果能Ping通,即说明这部分没有问题。如果出现超时情况,则要检查计算机的网卡是否与机器上的其它设备存在中断冲突的问题。通过查看系统属性中的设备管理器,查看是否在网络适配器的设备前面有黄色惊叹号或红色叉号,如有则说明硬件的驱动程序没有安装成功,可删除后重新安装。另外,要确保TCP/IP协议安装的正确性,并且要绑定
5、在你所安装的网卡上。如果重新安装后还是Ping不通回送地址,最好换上一块正常的网卡试一试。由于在局域网中划分了VLAN,所以连在不同VLAN中的计算机都有各自不同的IP地址、子网掩码和网关。要在机器的网络属性中设定的IP地址等数据与连接的VLAN相匹配,否则将出现网络不通的情况。 当确保了计算机的硬件设备和网络配置正确后,接着就要查看计算机与交换机之间的双绞线,交换机的RJ45端口或交换机的配置是否有问题。此时我们要Ping上网计算机所在VLAN的网关,不通的话就要分段检查上面所说的各项。 最简单的方法是检查双绞线,用线缆测试仪检测双绞线是否断开。双绞线没有问题,就要查看交换机的端口是否坏了。
6、交换机每一个端口都有状态指示灯以询问一下其它网管人员就可以排除了,如果不放心可以对照查看。交换机的参数配置表也是网络管理员必备的资料之一,并且随着网络用户的变化要不断地修改,检测到此,如果端口指示灯不亮,就只能是端口损坏了,可以把跳线接到正常使用的端口上排除其它原因,确定是端口的问题。2、一批联网计算机上不了网对于同时有一批计算机上不了网的故障,首先要找到这些计算机的共性,如是不是属于同一VLAN或接在同一交换机上的,若这些计算机属于同一VLAN,且属于计算机分别连接于不同的楼层交换机,那么检查一下路由器上是否有acl限制,在路由器上对该VLAN的配置是否正确,路由协议(如我局的OSPF协议)
7、是否配置正确。若这些计算机属于同一交换机,则应到机房检查该交换机是否有电源松落情况,或该交换机CPU负载率是否很高,与上一级网络设备的链路是否正常。 通常某交换机连接的所有电脑都不能正常与网内其它电脑通讯,这是典型的交换机死机现象,可以通过重新启动交换机的方法解决。如果重新启动后故障依旧,则检查一下那台交换机连接的所有电脑,看逐个断开连接的每台电脑的情况,慢慢定位到某个故障电脑,会发现多半是某台电脑上的网卡故障导致的。 故障通常是交换机的某个端口变得非常缓慢,最后导致整台交换机或整个堆叠慢下来。通过控制台检查交换机的状态,发现交换机的缓冲池增长得非常快,达到了90或更多。原因及解决方法为:首先
8、应该使用其它电脑更换这个端口上原来的连接,看是否由这个端口连接的那台电脑的网络故障导致的,也可以重新设置出错的端口并重新启动交换机,个别时候,可能是这个端口损坏了。三、故障定位及排除的常用方法(一) 告警性能分析法 通过网管获取告警和性能信息进行故障定位。我们单位使用了网络网管软件,可以对全单位的网络设备进行管理,平时多观察各设备CPU负载率和各线路的流量。当有人反映不能连接至网络或网速很慢时,可通过网管观察计算机与交换机的连接情况,是否有时断时通的现象,交换机CPU负载率是否很高,线路流量是否很大。通过观察设备端口状态,分析和观察交换机哪个端口所接的计算机发包量不太正常。 (二)查看网络设备
9、日志法 经常看一下网络设备的日志,分析设备状况。我曾经通过showlonging命令观察到4006交换机下连的2950交换机经常每隔7小时down掉,然后又up,因时间间隔较长,单位人员未感觉网络中断,在此期间我们检查并确定了光缆、光收发器、网线、交换机配置、交换机端口均正常,后来的间隔时间由原来的7小时减为7分钟。由此我们立即判定2950交换机本身有故障,马上将已准备好的备用交换机换上,从而减少了处理故障的时间,并在最短时间内恢复网络。 (三)替换法 替换法就是使用一个工作正常的物体去替换一个工作不正常的物体,从而达到定位故障、排除故障的目的。这里的物件可以是一段线缆、一个设备和一块模块。
10、(四)配置数据分析法 查询、分析当前设备的配置数据,通过分析以上的配置数据是否正常来定位故障。若配置的数据有错误,需进行重新配置。 当我们组建好了一个小型局域网后,为了使网络运转正常,网络维护就显得很重要了。由于网络协议和网络设备的复杂性,许多故障解决起来绝非像解决单机故障那么简单。网络故障的定位和排除,既需要长期的知识和经验积累,也需要一系列的软件和硬件工具,更需要你的智慧。因此,多学习各种最新的知识,是每个网络管理员都应该做到的。四、具体工作中的实践经验1、我在单位实习实训工作的具体实施在开始动手排除故障之前,最好先准备一支笔和一个记事本,然后,将故障现象认真仔细记录下来。在观察和记录时一
11、定注意细节,排除大型网络故障如此,一般十几台电脑的小型网络故障也如此,因为有时正是一些最小的细节使整个问题变得明朗化。2、识别故障现象我排除故障之前,先确切地要了解网络上到底出了什么毛病,是不能共享资源,还是找不到另一台电脑,如此等等。知道出了什么问题并能够及时识别,是成功排除故障最重要的步骤。为了与故障现象进行对比,作为网络管理员必须知道系统在正常情况下是怎样工作的,反之,就不好对问题和故障进行定位的。识别故障现象时,应该向操作者询问以下几个问题:(1)当被记录的故障现象发生时,正在运行什么进程(即操作者正在对电脑进行什么操作)。(2)这个进程以前运行过吗?(3)以前这个进程的运行是否成功?
12、(4)这个进程最后一次成功运行是什么时候?(5)从那时起,哪些发生了改变?带着这些疑问来了解问题,才能对症下药排除故障。3、对故障现象进行详细描述当处理由操作员报告的问题时,对故障现象的详细描述显得尤为重要。如果仅凭他们的一面之词,有时还很难下结论,这时就需要管理员亲自操作一下刚才出错的程序,并注意出错信息。例如,在使用Web浏览器进行浏览时,无论键入哪个网站都返回该页无法显示之类的信息。使用ping命令时,无论ping哪个IP地址都显示超时连接信息等。诸如此类的出错消息会为缩小问题范围提供许多有价值的信息。对此在排除故障前,可以按以下步骤执行:(1)收集有关故障现象的信息;(2)对问题和故障
13、现象进行详细描述;(3)注意细节;(4)把所有的问题都记下来;(5)不要匆忙下结论。4、列举可能导致错误的原因作为网络管理员,则应当考虑,导致无法查看信息的原因可能有哪些,如网卡硬件故障、网络连接故障、网络设备(如集线器、交换机)故障、TCP/IP协议设置不当等等。注意:不要着急下结论,可以根据出错的可能性把这些原因按优先级别进行排序,一个个先后排除。5、缩小搜索范围对所有列出的可能导致错误的原因逐一进行测试,而且不要根据一次测试,就断定某一区域的网络是运行正常或是不正常。另外,也不要在自己认为已经确定了的第一个错误上停下来,应直到测试完为止。除了测试之外,网络管理员还要注意:千万不要忘记去看
14、一看网卡、Hub、Modem、路由器面板上的LED指示灯。通常情况下,绿灯表示连接正常(Modem需要几个绿灯和红灯都要亮),红灯表示连接故障,不亮表示无连接或线路不通。根据数据流量的大小,指示灯会时快时慢的闪烁。同时,不要忘记记录所有观察及测试的手段和结果。6、隔离错误经过一番折腾后,这时我基本上知道了故障的部位,对于电脑的错误,就可以开始检查该电脑网卡是否安装好、TCP/IP协议是否安装并设置正确、Web浏览器的连接设置是否得当等一切与已知故障现象有关的内容。然后剩下的事情就是排除故障了。注意:在开机箱时,不要忘记静电对电脑的危害,要正确拆卸电脑部件。7、故障分析处理完问题后,作为网络管理
15、员,还必须搞清楚故障是如何发生的,是什么原因导致了故障的发生,以后如何避免类似故障的发生,拟定相应的对策,采取必要的措施,制定严格的规章制度。虽然故障原因多种多样,但总的来讲不外乎就是硬件问题和软件问题,说得再确切一些,这些问题就是网络连接性问题、配置文件选项问题及网络协议问题。8、具体案例:我公司业务部有一台电脑无法登录到服务器,我分析以下原因可能导致连通性故障:网卡未安装,或未安装正确,或与其他设备有冲突;网卡硬件故障;网络协议未安装,或设置不正确;网线、跳线或信息插座故障;Hub电源未打开,Hub硬件故障,或Hub端口硬件故障;服务器电源故障。截图Ping 排除方法确认连通性故障当出现一
16、种网络应用故障时,如无法接入Internet,首先尝试使用其他网络应用,如查找网络中的其他电脑,或使用局域网中的Web浏览等。如果其他网络应用可正常使用,如虽然无法接入Internet,却能够在网上邻居中找到其他电脑,或可ping到其他电脑,即可排除连通性故障原因。如果其他网络应用均无法实现,继续下面操作。看LED灯判断网卡的故障首先查看网卡的指示灯是否正常。正常情况下,在不传送数据时,网卡的指示灯闪烁较慢,传送数据时,闪烁较快。无论是不亮,还是长亮不灭,都表明有故障存在。如果网卡的指示灯不正常,需关掉电脑更换网卡。对于Hub的指示灯,凡是插有网线的端口,指示灯都亮。由于是Hub,所以,指示灯
17、的作用只能指示该端口是否连接有终端设备,不能显示通信状态。用ping命令排除网卡故障使用ping命令,ping本地的IP地址或电脑名(如ybgzpt),检查网卡和IP网络协议是否安装完好。如果能ping通,说明该电脑的网卡和网络协议设置都没有问题。问题出在电脑与网络的连接上。因此,应当检查网线和Hub及Hub的接口状态,如果无法ping通,只能说明TCP/IP协议有问题。这时可以在电脑的控制面板的系统中,查看网卡是否已经安装或是否出错。如果在系统中的硬件列表中没有发现网络适配器,或网络适配器前方有一个黄色的!,说明网卡未安装正确。需将未知设备或带有黄色的!网络适配器删除,刷新后,重新安装网卡。
18、并为该网卡正确安装和配置网络协议,然后进行应用测试。如果网卡无法正确安装,说明网卡可能损坏,必须换一块网卡重试。如果网卡安装正确则原因是协议未安装。如果确定网卡和协议都正确的情况下,还是网络不通,可初步断定是Hub和双绞线的问题。为了进一步进行确认,可再换一台电脑用同样的方法进行判断。如果其他电脑与本机连接正常,则故障一定是先前的那台电脑和Hub的接口上。如果确定Hub有故障,应首先检查Hub的指示灯是否正常,如果先前那台电脑与Hub连接的接口灯不亮说明该Hub的接口有故障(Hub的指示灯表明插有网线的端口,指示灯亮,指示灯不能显示通信状态)。如果Hub没有问题,则检查电脑到Hub的那一段双绞
19、线和所安装的网卡是否有故障。判断双绞线是否有问题可以通过双绞线测试仪或用两块三用表分别有两个人在双绞线的两端测试。主要测试双绞线的1、2和3、6四条线(其中1、2线用于发送,3、6线用于接收)。如果发现有一根不通就要重新制作。检查服务器电源灯有没有亮,电源的风扇是否有在转,服务器有没有通电。通过上面的故障压缩,我们就可以判断故障在哪个地方,经过一番检查我终于查出故障原因是Hub端口硬件故障,我通过更换Hub端口解决了故障,使这台电脑重新正常登录到服务器了。总之,经过这段日子的校外实习实训我掌握了计算机网络常见故障处理及维护方法,通过单位的实践再结合我所学的专业知识,让我收获很大,希望将来能更好
20、的发挥出来。五、结束语计算机网络技术发展迅速,网络故障也十分复制,本文介绍了常见的几类故障及其维护方法。为了在网络出现故障时及时对网络进行维护,以最快的速度恢复网络的正常运行,在网络维护中还需要注意以下几个方面:1、建立完整的组网文档,以供维护时查询。如系统需求分析报告、网络设计总体思路和方案、网络扩扑结构的规划、网络设备和网线的选择、网络的布线、网络的IP分配,网络设备分布等等。2、做好网络维护日志的良好习惯尤其是有一些发生概率低但危害大的故障和一些概率高的故障,对每台机器都要做完备的维护文档,以有利于以后故障的排查。这也是一种经验的积累。3、提高网络安全防范意识,提高口令的可靠性,并为主机加装最新的操作系统的补丁程序和防火墙、防黑客程序等来防止可能出现的漏洞。参考文献1雷震甲著,计算机网络西安电子科技大学出版社2谢希仁著,计算机网络(第五版)电子工业出版社3Greg Tomsho著,网络维护和故障诊断指南M北京:清华大学出版社4孙远运,李舒杨等著计算机网络故障排除与维护实用大全建筑工业出版社