《第8讲:计算机网络故障诊断与排除-服务器故障诊断与排除-计算机网络故障诊断与排除(第2版)-教学课件.ppt》由会员分享,可在线阅读,更多相关《第8讲:计算机网络故障诊断与排除-服务器故障诊断与排除-计算机网络故障诊断与排除(第2版)-教学课件.ppt(97页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心计算机网络故障诊断与排除计算机网络故障诊断与排除中科院计算所计算机职业技能培训中心中科院计算所计算机职业技能培训中心 黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心计算机网络故障诊断与排除计算机网络故障诊断与排除讲座教材讲座教材 计算机网络故障诊断与排除计算机网络故障诊断与排除第第 2 2 版版 清华大学清华大学出版社出版社(2010.12)黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心第第8讲:讲:服务器故障诊断与排除服务器故障诊断与排除本章重点
2、介绍以下内容:w服务器概述;wLinux概述;w单机/服务器系统引导;wLinux/Unix常见基本问题;w服务器常见的故障现象和解决方法;w服务器问答;wBootPROM及其故障排除;wApache服务器的故障排除;wApache目录访问权限错误;wApache验证模式错误;wSAMBA排错;w多NOS文件服务;w文件服务失效;w操作系统安装过程中需注意的问题。黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心8.1 服务器概述服务器概述服务器是一台被网络工作站访问的计算机系统,通常是一个高性能计算机,是网络的核心设备,服务器的概念应从下面几点来考虑。黎黎连连业
3、业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心8.1.2服务器功能体系和性能体系1.服务器功能体服务器功能性配置同样是非常重要的衡量指标。它不仅与服务器的性能表现息息相关,而且在长期的使用过程中还决定了用户总体拥有成本的水平。功能差的服务器可能在不可预知的情况下宕机而造成用户的巨大损失;也可能因不能及时升级而坐失良机,成本无形增大;更可能因为服务器的管理性不足,不得不增加人力的投资。服务器的功能有4大特性:w可用性;w可扩展性;w可管理性;w安全性。w有些厂商也把安全性和可用性合称为可靠性、
4、容错性等,这只是名字的不同。安全性有基于硬件与软件之分,在实际应用中,更多是从软件系统去衡量。w服务器功能4大特性中往往包含了许多服务器独有的技术。可用性主要是考察服务器热插拔和冗余特性。热插拔技术属于PNP技术,是由系统BIOS将热插拔信息传给BIOS配置管理程序,并由该程序对热插拔部件进行重新配置(如中断、DMA通道等)。由于它需要插槽和设备的断电保护设计,成本要高一些。热插拔技术有利于用户在保证业务连续运作的基础上扩展/改善系统。除了内存、硬盘、各类PCI卡可热插拔外,一些高端服务器的CPU也是可以热插拔的。冗余技术是一种部件级的“热备概念”。它能显著增强系统的容错或连续运作能力。从概率
5、的角度看,单部件可用性是90%,那么加一个冗余部件后,其可用性将增加到99%。冗余部件主要包括风扇、电源、PCI卡、PCI控制器、RAID控制器等,内存和CPU也可做成冗余设计。w可扩展性内容很广泛,但在实际应用中,两大扩展性值得关注。一是存储的扩展。它包括内部与外部的扩展。内部的存储扩展由服务器的托盘架、电源和数据线等走线设计决定,外部的存储扩展主要指服务器是否提供外部存储接口。二是PCI扩展。在应用中,某些特定用户需要再增加特定的PCI卡,如视频处理、安全认证等。黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心2.服务器性能体系服务器性能有三大指标:wCPU
6、;wI/O;wWeb。黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心8.1.3服务器操作系统作为服务器软件的基础,操作系统常常被人们所忽略。但是随着企业业务变得越来越复杂,选择合适的操作系统也就显得越来越重要。现在的操作系统在商务活动的组织和实施过程中发挥着支配作用。服务器操作系统有:wWindows;wUnix;wLinux。黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心wLinux有3种操作系统,主要是一种伴有开启资源模式UNIXOS的资源软件
7、,可以使编程者对资源重新更改、再分配,称为“因特网时间”。Linux具有全球范围的编程者和开发者,不时对操作系统的内部进行更改和完善。Linux的可靠性使其成为因特网及其他网络活动的完善选择。Linux操作系统流行的版本目前有8个,它们是:wRedHatLinux它基于rpm的包结构,核心代码约有200MB。其好处是安装使用简单方便,并且rpm包的结构也使包的安装和卸载变得更方便。另外,RedHat的更新升级版出得也很及时,被评为BestNetworkOS。RedHatLinux同时也支持Intel、Alpha和SPARC平台,这也是RedHat公司最引以自豪的地方。一般推荐入门时使用RedH
8、atLinux,因为它安装容易。若使用Linux已经有一段时间,那就无所谓了,因为自己有了评价不同版本的能力,这时就可以根据自己的习惯、喜好和用途来选择。wSlackwareLinuxSlackware基于tgz的包结构,是历史很悠久的Linux发布版本,其核心部分有120MB左右。Slackware比较公认的是做服务器时性能较好。SlackwareLinux支持大多数IntelPC。它支持对称多处理和PCI,并为一些处理器进行了特别的编码优化。wDebianLinuxDebianLinux基于deb的包结构,这也是一个不错的发布版本,与GNU的关系紧密。它收集的软件很全,代码约有400MB,
9、而且其deb包安装删除也很方便。DebianLinux由一群自愿者进行维护和升级。它的先进的管理工具包使得安装和维护都异常简单。发布前全面的测试保证了系统的高度可靠性。一个公开的bug跟踪系统随时监控用户的反馈。黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心SuSELinuxwSuSE公司是从XServer开始,和Xfree86合作开发x86上的XServer。SuSE也有自己的发布版本。由于这是一家德国公司,该发行版在欧洲用得更为广泛。wSuSELinux有超过800个预设软件包和400页的参考手册。其中的YaST实用工具允许用户自己安装、设置和进一步配置系
10、统。SuSE支持XServer的高端图形卡。wLinuxMandrakewLinuxMandrake是32位多任务操作系统。它可以运行在所有Intel以及与其的结构中。wCalderaOperLinuxwOpenLinux包括一些实用工具、图形界面、安装指南和第三方的应用软件等。wLinuxWarewLinuxWare是一个十分灵活、易于安装的以及类似于Unix的操作系统。主要面向对Unix系统感兴趣的学生家庭PC使用者。wTurboLinuxwTurboLinux包括一系列的应用程序、一个GUI的桌面、文档和技术支持。黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中
11、中心心黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心8.2.3Linux的现状8.2.3.1Linux用户目前Linux的用户可分为个人用户、专业用户和大规模采用了Linux系统的商业应用用户。1.个人用户w个人用户也可以说是业余用户,大多为电脑爱好者。对于个人用户来说,完全是出于好奇,或者是抱着用用看的心态才安装Linux的,很少有用户在安装前就希望它能真正干点什么。这类用户中,学生占据了很大的比例。w个人用户大多对Unix不了解,更多的人在安装Linux系统之前,根本未曾接触过Unix。对于这类用户,看到长长的控制台命令就有点不知所措。遇到复杂的配置过程,
12、大多数用户都是无计可施。w个人用户在Linux的使用者占据着极大的一部分。随着Linux的进一步发展,这些用户是Linux得以发展的潜在的最大用户群。随着Linux的各种发行版本对系统配置的进一步简单化,个人用户的数量就会大大增加。黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心3.商业用户w由于要向客户提供商业服务,所以商业用户在选择系统时特别认真,他们通常要考虑很多因素,如安全性、可靠性、费用等。综合各种因素,有的商业用户选择了Linux,这说明Linux已相当稳定,正在逐渐被商
13、业用户所接受。当然,目前选择使用Linux系统的商业用户还不够多,广泛使用Linux的商业用户多为信息服务提供商,如大量的ISP或ICP等。w商业用户看中的是Linux的可靠性、免费性。但是,鉴于人们对Linux的观望态度、不信任态度(在人们的意念中,花钱的东西肯定比不花钱的东西要好),目前Linux的商业还不够多。但是,随着Linux优秀的性能逐渐被广大的商业用户所认识,总会有一天,它会同今天的Unix一样,最终被人们接受。黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心除了上述3种用户外,Linux的应用场合还有以下几种情况:wInternet服务器Linu
14、x是Internet的产物,而且擅长提供Internet服务。Linux默认提供新闻、电子邮件和FTP等许多功能,可以访问网络内部用户,也可以通过整个Internet发布消息。如果与调制解调器相连,Linux就变成了强大的Internet访问接入点。大量的ISP因为Linux的可靠性而选择了它。wX终端客户Linux对X11的优秀支持简化了在应用服务器上远程运行应用的过程,并且可以在本地的Linux工作站上显示信息。Linux提供了全方位的多媒体服务,包括声音、动画和高级图像支持,所以比传统X终端更占优势。如果需要将其Linux机器用于多台X终端,则可以非常快速而方便地实现。黎黎连连业业中中科
15、科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心wUnix开发平台Linux能够支持Unix开发,它不但支持主流语言,也支持其他语言。其跨平台的环境还可以为其他Unix操作系统平台产生二进制代码。GNUC、CNUC+、GNUFortran77ADA、Pascal、Modula2和3、Tcl/tk、Scheme和SmallTalk/X均可免费使用,并附带详细的工作代码库。多种语言的编译器有助于节省开发时间。所有这些,再加上灵活的Shell语言编辑器、源代码包和详细文档都给了编程者充分的可定制环境。另外,
16、它也能作为一个理想的计算机学习系统。黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心8.2.3.2Linux的功能目前,使用Linux的用户越来越多,其原因就是它提供的功能既强又全面。具体表现为:w提供WWW服务WWW服务在全球所有的WWW服务器中占据了将近60%70%的份额,这在很大程度上因为Apache软件包,目前它的版本为Apache1.3.9。通过Wu-ftp提供FTP服务,Sendmail提供电子邮件服务,inn提供新闻组服务。另外,Linux还被广泛用作DNS服务器、NTS服务和NFS服务。w提供文件和打印服务长期以来,人们习惯了使用NT提供文件服务
17、,但是,用过NetWare的人都会发现,NT提供的文件服务功能太弱。例如,它无法对用户使用的磁盘进行定额限制,只要管理人员向用户开发了写入权限,一个贪婪的用户就可以将整个硬盘都复制满数据。而使用Linux就不会这样,Linux下的Samba服务器可以轻松为用户提供文件和打印服务,还可以通过磁盘定额(Quote)达到同样的目的。黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心w提供数据库服务数据库服务是所有商业用户在选择系统是首先要考虑的问题,因为所有的商业系统几乎没有不用数据库系统的。Linux提供了数据库系统的全力支持,最早的数据系统有MySQL、Postgr
18、eSQL、msql等,其中MySQL可以支持到5TB以上的数据库。后来,随着Linux影响的不断扩大,各大数据库厂商纷纷看中Linux广阔的前景,先后推出了自己基于Linux系统下的大型数据库。现在,运行在其他环境下的大型数据库系统,都可以在Linux下运行,如SybaseASE11.0.3.3、SybaseASE11.9.2、Informix-se、InformixDynimicServer7.3、Oracle8.0.5forLinux、Oracle8.1.5forLinux、IBMDB2forLinux6.1Beta、Notes/Domino5.0.1等。w提供网络服务Linux可提供网络
19、服务,整个局域网上的用户可全部接入Internet。面向用户提供、E-mail等服务。黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心8.2.3.3Linux的缺陷尽管Linux有着众多的优点,但缺点还是明显的,主要表现为以下几个方面。1.应用软件还不丰富w在Linux下目前的应用软件还不太多,还没有像Word、Wordprofect、Wordpro、WPS一样的重量级字处理软件。这对一般用户来说是一大困难。w从处理中文的角度上来讲,用户目前需要的是像运行在英文Windows下的中文之星、四通利方那样的外挂式中文系统。Linux缺少全面汉化或者说是内核汉化的中文
20、系统。在众多的版本中仅有红旗服务器版本2.0对中文的支持大大加强,用户可以得心应手地运用中文来处理问题。黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心2.用户使用还不太方便w有不少Linux系统的崇拜者声称Linux将要打败NT。客观地说,这在短期内是不可能的。PC操作系统的市场占据了大多数的个人用户,而个人用户并不同于专业用户。Linux要打败NT和Windows,首先要做的事情是:让Linux易用起来。虽然目前的Linux在安装界面、操作界面上较之以前的发行版本有了很大的提高,但是,其界面还不够友好,易用性目前还不如Windows。只有在操作易用性、安装易
21、用性、配置易用性方面的问题解决了,Linux才有可能打败NT。黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心8.2.4Linux系统与其他系统的比较8.2.4.1与DOS系统比较w在同一系统上运行Linux和MS-DOS已很普遍,就发挥处理器功能来说,MS-DOS没有完全实现x86处理器的功能,而Linux完全在处理器保护模式下运行,且开发了处理器的所有特性。Linux可以直接访问计算机内的所有可用内存,提供完整的Unix接口。而MS-DOS只支持部分Unix的接口。w就使用费用来
22、说,Linux和MS-DOS有着两种完全不同的价位。与其他商业操作系统相比,MS-DOS价格比较便宜,而且在PC机用户中有很大的占用率,任何其他PC机操作系统都很难达到MS-DOS的普及程序。用户还是要付费的,而Linux是免费的,用户可以从Internet上或者通过其他途径获得它的版本,而且可以任意使用,不需要考虑费用问题。w就操作系统的功能来说,MS-DOS是单任务的操作系统,一旦用户运行了一个MS-DOS的应用程序,它就独占了系统的资源,用户不可能再同时运行其他应用程序。而Linux是多任务的操作系统,用户可以同时运行多个应用程序。黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业
23、技技能能培培训训中中心心8.2.4.2与Windows系统比较w从发展背景看,Linux与其他操作系统的区别是,Linux是从一个比较成熟的操作系统发展而来的。而其他操作系统,如WindowsNT等,都是自成体系,没有对应的相依托的操作系统。这一区别使得Linux的用户能大大地从Unix团体贡献中获利。因为Unix是世界上使用最普遍、发展最成熟的操作系统之一。无论是Unix的作者还是Unix的用户,都认为只有Unix才是一个真正的操作系统,许多计算机系统(从个人计算机到超级计算机)都存在Unix版本,Unix的用户可以从很多方面得到支持和帮助。因此,Linux作为Unix的一个克隆产品,同样会
24、得到相应的支持和帮助,直接拥有Unix在用户中建立的牢固的地位。w从使用费用上看,Linux与Windows操作系统的区别在于Linux是一种开放、免费的操作系统,而Windows操作系统都是封闭的系统,需要有偿使用。这一区别使得用户能够不用花钱就能得到很多Linux的版本以及为其开发的应用软件。OS/2和WindowsNT等操作系统是具有版权的产品,其接口和设计均由某一公司控制,使用者当然是要付费的。黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心8.2.5Linux支持的硬件Linux支持的硬件如下:wIntelX86及兼容(32bit)wIntelltan
25、ium(64bit)wAMD(64bit)wIBMPowerPC(i系列和p系列)wIBM主机(z系列和S/390)黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心2.单机/服务器系统引导单机/服务器系统引导主要表现为:(1)磁盘引导区结构磁盘引导使用debug程序来读出主引导扇区。操作:wU100wMovax,0201wMovbx,7c00wMovcx,0001wMovdx,0080wInt13wInt3黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心
26、心(2)主引导扇区结构w主引导程序范围为7C007C8A,接着是数据区。中间很大一部分是07DBE7DFD,它之间为4个分区表。每个分区表占用16B。主引导扇区最后两个字节55AA是已分区的标志。分区表的16B数据结构如下:w偏移量0含义:引导标志(80h表示活动分区,00h表示非活动分区,其他非法值)。w偏移量1含义:本分区的起始磁头号。w偏移量23含义:本分区的起始扇区号(字节2的低6位)和起始柱号(10位,包括字节高的高2位和字节3)。w偏移量4含义:分区类型(1DOS,12位FAT;2XENIX;4DOS,16位FAT,小于32MB5扩展DOS;6DOS,16位FAT,大于32M;0D
27、Bh并发DOS)。黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心文件结构w在可执行文件中,com文件结构是最简单的。com文件只使用一个段,文件中的程序和数据的大小限制在64KB内。w执行一个com文件时,DOS把com文件装入到系统分配的一个内存块中。在内存块的最前面为该程序提供一个程序段的前缀PSP,PSP的大小为100H字节,com文件的内容直接读入到PSP之后的内存中。在运行com文件程序前,4个段寄存器CS、DS、ES、SS都初始化为PSP的段地址,堆栈指针SP设置为FF
28、FEH,指令指针IP设置为100H,然后开始执行这个com程序。黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心8.4 Linux/Unix常见基本问题常见基本问题黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心8.5服务器常见的故障现象和解决方法8.5.1服务器故障服务器故障的可能性包括4个方面,即服务器的软件故障、操作系统故障、服务器硬件故障和网络服务故障。1.服务器的软件故障w服务器的软件故障是服务器故障中占约占70的、较容易出现的故障。导致服务
29、器出现软件故障的因素很多,常见的有服务器BIOS版本太低、服务器的管理软件或服务器的驱动程序有BUG、应用程序有冲突及人为造成(非正常关机、不安操作流程操作)的软件故障等。同时还有因软件升级、病毒导致软件停止运行等原因。软件故障的诊断较为复杂,首先应确定是否为人为操作不当造成的,可以让操作人员重现一次故障出现过程以排除人为操作不当因素。然后根据警示声响、错误代码、检查相关日志及结束可疑程序等进行诊断。最难诊断的是软件冲突造成的故障,软件冲突故障更多的是需要维护及管理人员的经验及观察。服务器软件故障排除包括3个方面:(1)经常对FIRMWARE及BI0S进行更新。(2)是服务器软件的更新,经常更
30、新可以解决因BUG等软件自身原因所造成的软件故障。但是要注意,不正确的升级方法也会导致机器出现软件故障。(3)因人为因素造成的软件故障,此类故障可以通过正确实用的培训来解决。黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心2.操作系统故障操作系统故障wWindows2000Server和WindowsServer2003是为724小时不间断运行设计的,因此,可以保证长期稳定地正常运行,通常不会出现蓝屏、速率变慢、系统瘫痪等系统故障。然而,Windows2000Server和WindowsServer2003本身也存在着许多系统和安全漏洞,非常容易招致蠕虫病毒或其
31、他各种恶意攻击。(1)病毒侵袭)病毒侵袭w蠕虫病毒侵袭侵袭,导致网络瘫痪,对网络极具破坏性和杀伤力。可采取以下方式防范病毒攻击:只提供网络服务。除非维护需要,否则,不要直接对服务器进行操作,更不要将服务器作为普通计算机使用,随意使用服务器浏览Web网站、收发电子邮件,以避免由于访问恶意网页或邮件,而感染病毒。关闭不需要的服务。关闭或删除系统中不需要的服务,只打开网络服务所必须使用的端口。提供的服务和打开的端口越少,可被利用的安全漏洞也就越少,服务器就越不容易被恶意攻击,也就越安全。安装系统补丁。绝大多蠕虫病毒都是利用系统漏洞进行传播的,及时下载并安装微软的WindowsUpdate网站Wind
32、ows系统(包括应用程序)的安全补丁。安装病毒防火墙。仅有系统安全补丁是不够的,还必须安装专业的防病毒软件,并打开防病毒软件的实时监控功能,及时发现并清除(或隔离)已经感染的病毒。另外,应当及时升级防病毒程序的病毒库和引擎,以确保能够识别并清除最新发现的病毒。黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心(2)磁盘空间太小)磁盘空间太小w作为网络服务器,往往需要2GB以上的空间用于存储临时文件。当剩余的硬盘空间较少时,将严重影响服务器的性能,使响应速度变慢,严重时甚至会导致系统瘫痪。系统要拥有足够的剩余空间。(3)垃圾文件过多)垃圾文件过多w系统和网络服务在正
33、常运行过程中会产生一些临时文件、垃圾文件和磁盘碎片。正常情况下,临时文件会被系统自动删除。然而,在非正常关机或应用程序非正常退出时,临时文件将不会被删除。随着使用时间的延长,垃圾文件会越来越多,除了会大量占用宝贵的硬盘空间外,还将导致系统运行速度变慢。因此,应当定期执行系统工具中的“磁盘清理”,彻底清除不再使用的临时文件和垃圾文件。黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心(4)蓝屏故障)蓝屏故障w导致蓝屏故障的原因主要非常多,CPU过热或内存故障、系统硬件冲突、系统缺陷、病毒或黑客攻击、注册表中存在错误或损坏、启动时加载程序过多、程序版本冲突、虚拟内存不
34、足造成系统多任务运算错误、动态链接库文件丢失、系统资源冲突或资源耗尽等都会产生蓝屏。另外,软/硬件存在冲突也很容易出现蓝屏。黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心3.服务器硬件故障w硬件故障并不单单指硬件有问题,它也指硬件之间不兼容。因为服务器的正常运作需要各部件之间的大力协调。建议采购各元件时,都采用用原品牌原装的配件。非原品牌非原装的配件,不能支持服务器的某些功能,严重的会影响到服务器的正常使用。w由于服务器本身在硬件选用上非常严格,所以,通常情况下,在非人为干预情况下,发生服务器故障的可能性比较小。所以,硬件故障往往是在安装新的板卡、修改系统配置
35、文件,或者进行扩容后发生的。一般情况下服务器硬件故障主要是:服务器内部散热受阻等情况下出现的。因此,服务器要经常检查其散热相关部件,察看是否有因灰尘较多影响通风等现象。硬件耗损出现的硬件故障,常见故障为电源系统、CPU、内存、外部总线及负载系统。接触不良在硬件故障中较为常见。其主要发生在各种卡类、内存、CPu等与主板的接触不良,或电源线、数据线等的连接部到位。要避免硬件故障发生频率,服务器管理人员必须注意服务器的温度、湿度的环境;电压也要符合。在开、关服务器上必须符合正常的流程。工作人员必须严格执行操作流程。黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心4.网
36、络服务故障网络服务故障w由于操作系统Bug、应用程序缺陷、内存质量、硬盘可靠性等各种不可预知的因素,有时会导致网络服务中断。w当网络服务故障发生时,通常都会在系统日志有记载,可以通过“管理工具”“事件查看器”窗口查看。通常情况下,系统故障会记录在“系统”文件夹,如果是应用程序或非Windows内置的网络服务发生故障,则会记录在“应用程序”文件夹。w当发生网络故障时,可以采用以下几个步骤进行处理:w重新启动服务。依次打开“管理工具”“服务”窗口,右击已经发生故障的服务,选择“启动”或“重新启动”。如果网络服务通过其他控制台管理,也可在相应的控制台中重新启动。w重新启动计算机。当重新启动服务仍然无
37、法正常实现网络服务时,可以选择重新启动计算机,清除计算机内存重新加载网络服务。w重新安装服务或应用程序。如果重新启动计算机仍然不能排除故障,可以考虑卸载并重新安装相应的Windows组件或应用程序。黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心8.5.2服务器常见故障诊断与排除1.故障现象:服务器无法启动造成服务器无法启动的主要原因:检查电源线和各种I/O接线是否连接正常。检查连接电源线后主板是否加电。将服务器设为最小配置(只接单颗cpu,最少的内存,只连接显示器和键盘)直接短接主板开关跳线,看看是否能够启动。检查电源,将所有的电源接口拔下,将电源的主板供电口
38、的绿线和黑线短接,看看电源是否启动。市电或电源线故障(断电或接触不良)电源或电源模组故障内存故障(一般伴有报警声)CPU故障(一般也会有报警声)主板故障其它插卡造成中断冲突黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心2.故障现象:开机自检无法通过解决方法:(1)准备一个跳线帽。(2)切断机器电源,将机箱打开,用CMOSCLEAR跳线的跳线帽将CMOSCLEAR跳线的另外两个针短接(跳线参看主板说明书)。(3)机器加电,自检,等机器自检完毕,报CMOS已被清除,然后将机器电源关掉,把跳线复原即可。(4)重新开机。黎黎连连业业中中科科院院计计算算所所计计算算机机
39、职职业业技技能能培培训训中中心心3.故障现象:处理器报错或自检过程中只找到一个处理器解决方法:(1)开机,按F2键,进入SETUP。(2)依次选择MAINPROCESSORCLEARPROCESSORERRORS,将选项的值设置为YES。(3)依次选择ADVANCEDRESETCONFIGURATIONDATA,将选项的值设置为YES。(4)依次选择SERVERPROCESSORRESET,将选项的值设置为YES。(5)依次选择SERVERSYSTEMMANAGEMENT按回车键后选择CLEAREVENTLOG,将选项的值设置为YES。(6)按F10键,保存退出。黎黎连连业业中中科科院院计计算
40、算所所计计算算机机职职业业技技能能培培训训中中心心4.故障现象:怎样格式化SCSI硬盘解决方法:开机,待出现Ctrl+A键信息时,按Ctrl+A键进入,选中通道A,再选中SCSIUTILITY,将检测到硬盘。选中要检测的硬盘,再选中FORMAT可对硬盘进行全面格式化,选中VERIFY可对硬盘进行检测,检查是否有坏道。注意:在格式化硬盘时不能中断或停电,否则会损坏硬盘。黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心5.故障现象:PL400CMOS如何清除解决方法:w位于3PinPwrLED和IntelNB82802AB8芯片之间的JBC2跳线,将2、3短接即可。
41、6.机器开机常见问题和解决方法(1)装完系统后,显示器出现花屏现象,系AGP显卡故障。更换后一切正常。(2)开机黑屏,不自检,并且报两声嘟声,系内存未插紧。重插内存,故障解决。(3)开机散热风扇不转,而机箱后侧风扇却转(说明主板已上电),系CPU散热风扇电源线插错插到机箱风扇电源接口。将其插到RIMM1侧面的CPU风扇接口后故障解决。7故障现象:物理内存插槽报错解决方法:开机,按F2键,进入SETUP,选择ADVANCEDMEMORYCONFIGURATION后回车,再选择CLEARSDIMMERRORS后直接回车,选择OK后存盘退出。8.故障现象:CPU报错解决方法:开机,按F2键,选择BI
42、OSADVANCEDCLEARCPUERRORS后直接回车。黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心9.故障现象:主板不支持USB设备解决方法:(1)开机,按F2键,进入BIOS。(2)选择ADVANCEDPERIPHERALCONFIGURATION后回车,将USBCONTROLLER项设为ENABLE,再将LEAGCYUSBSUPORT设为ENABLE即可。10.故障现象:机器安装系统(NT/2K)时始终无法找到硬盘解决方法:(1)确定硬盘的连接线路问题,如果连接没有问题,即开机自检如果检测到硬盘,则安装系统时无法找到硬盘,此时安装与硬盘连接的设备的
43、驱动程序。(2)加载硬盘的驱动程序需详细查看服务器系统安装指南。黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心8.6服务器问答问题1:有些基于XEON的服务器安装Windows2000后,有PCIDEVICE和中断控制器等未能驱动。w解决方法:将随服务器发给的主板光盘放入光驱,进入DRIVERS/对应的芯片目录(如E7500),安装目录内的INF文件即可。问题2:PT1300、PT2300安装Windows2000后有一个SCSII20设备不能驱动。w解决方法:这是硬盘背板未驱动,通过机箱光盘或从网站下载驱动,安装即可。问题3:PT1300、PT2300安装W
44、indows2000,未能在主板光盘上找到INF驱动。w解决方法:原装光盘未有INF,需从网站下载。黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心问题4:如何禁用/开启板载设备?w解决方法:(1):开机,按F2键,进入BIOS设置画面。(2):选择ADVANCEDONBOARDDEVICE。w使用或禁止集成IDERAID卡:将ONBOARDRAID设为ENABLE/DISABLE。w使用或禁止集成网卡:将ONBOARDNIC1/NIC2设为ENABLE/DISABLE。w使用或禁止集成USB:将ONBOARDUSB设为ENABLE/DISABLE。问题5:机器
45、在开机过程中报错(如CPU,或提示事件日志已满)w解决方法:(1):开机,按F2键,进入BIOS设置画面。(2):选择ADVANCEDEVENTLOGGING。w清除事件日志:将CLEARALLEVENTLOGS设为YES。w起用事件日志功能:将EVENTLOGGING设为ENABLE/DISABLE。w查看事件日志:在VIEWEVENTLOG项后按回车键。黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心问题6:PT2000、PT3000、PT4000在安装WindowsNT4.0过程中从软盘上加载驱动程序时找不到软驱?w解决方法:(1)确保主板的BIOS版本已
46、升级到1.12或以上。(2)开机按F2键,进入BIOS设置画面。(3)选择ADVANCEDINSTALLEDOSWIN2000/NET,NT4,OTHER,选中NT4。w选择ADVANCED,将NT3INSTALLATIONWORKAROUND设为ENABLE。问题7:怎样在机器开机自检时显示机器配置(或屏蔽开机LOGO)?w解决方法:(1)开机,按F2键,进入BIOS设置画面。(2)选择ADVANCED,将BOOT-TIMEGIAGNOSTICSCREEN设为ENABLE。黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心问题8:开机报警(带RAID卡的机器)。
47、w故障原因:磁盘阵列中的硬盘由于受意外的电流冲击、震动,或者由于硬盘自身物理损坏时会从阵列中离线,停止工作。此时,RAID卡会自动报警,发出警报以提示尽快恢复有危险的阵列。w解决方法:启动机器进入RAID卡配置界面,观察一下硬盘的状态,确认故障硬盘,及时恢复。w步骤:(1)如果硬盘是由于冲击、震动等原因造成的简单掉线,它的状态一般是FAILED。这时可对此硬盘做REBUILD。一般在屏幕上会有进度条显示。做到100%时硬盘可自动上线。(2)如果硬盘是由于物理损坏而造成的从阵列中离线,状态一般是DEAD,对此硬盘无法做REBUILD。只能更换新的硬盘,对此新硬盘做REBUILD,直至正常。黎黎连
48、连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心问题9:操作系统检测到的硬盘容量与硬盘实际容量不符合。w在使用计算机的过程中可能会发现这样一个现象,10GB的硬盘在操作系统中只识别到9GB左右,20GB的硬盘只有19GB,40GB的只有38GB左右,容量更大的硬盘差异更大。这是因为硬盘制造商对硬盘容量的定义和操作系统对硬盘容量算法不同,因此导致硬盘标识容量和操作系统中显示的实际容量存在误差。w硬盘厂商的标准:1GB=1000MB1MB1000KB1KB1000bytew操作系统的算法:1GB=1024MB1MB1024KB1KB1024bytew以40GB的硬盘为例计
49、算如下:w硬盘厂商的标准:40GB=40000MB=40000000KB=40000000000bytew操作系统的算法:40GB=40960MB=41943040KB=42949672960bytew40GB硬盘在操作系统中显示的容量为40000000000102410241024=37.2529GB,而且在分区和格式化后,系统会在硬盘上占用一些空间,提供给系统文件使用。所以,操作系统显示的总容量和硬盘的型号容量存在差异这是正常现象。黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心问题10:I硬盘常见错误与检测方法?w解决方法:1Scsi控制器自检无法通过,依
50、次检验硬盘,检测是否有硬盘无法自检通过。2Scsi控制器自检无法通过,检查设备的终结。3硬盘检测报错:startunitfailed.或timeout。硬盘坏。4硬盘检测时无法正确显示型号及其参数。进入SCSI设置,进行传输率等的设置。5校验硬盘时,报错或提示有坏扇区。6无法格式化硬盘。7硬盘盒常见故障:带硬盘笼的设备,检不到硬盘,将硬盘直接接到线缆上,自检正常。应为硬盘笼问题。硬盘盒无法加电。检查硬盘笼电源连接是否正常。黎黎连连业业中中科科院院计计算算所所计计算算机机职职业业技技能能培培训训中中心心8.7 Boot PROM及其故障排除及其故障排除黎黎连连业业中中科科院院计计算算所所计计算算