《HACMP_高可用性(122页).doc》由会员分享,可在线阅读,更多相关《HACMP_高可用性(122页).doc(120页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、-H A C M P High Availability Cluster Multi Processing前 言 现代企业的应用和数据都储存在计算机中 ,由计算机来处理 ,一旦计算机系统发生意外故障 ,而引起应用停止甚至重要数据丢失 ,必将造成巨大损失 ,因此企业计算对高可用性和可靠性的要求非常高 。IBM RS / 6000 系列通过 AIX 操作系统的支持 ,利用 HACMP 实现了多种功能的高可用群集多处理方案 。为高可用性计算提供了一个完美的解决方案 。 目 录一 : HACMP 的基本概念 二 : HACMP 的规划 1 :群集节点 2 :群集网络 3 :群集磁盘 4 :资源规划 5
2、 :应用规划 6 :用户 ID 规划三 : HACMP 的安装与配置 1 :HACMP 的安装 2 :群集的配置 ( 1 )定义群集拓扑结构 ( 2 )定义群集资源四 : HACMP 的测试五 : HACMP 的管理 一 :HACMP的基本概念 :IBM的高可靠性群集系统软件HACMP- High Availability Cluster Multi-Processing提供了RS/6000平台上关键应用的高可靠性解决方案,该软件能使一个群集内的所有的RS/6000系统不存在单点失效 ( 在群集中单独某一部分出现故障而引起对用户端的服务失效 ) 。HACMP系统能自动地检测系统硬件失效,重新配
3、置群集系统 ,使得所有的资源完全不受系统硬件失效的影响 ,从而提供了可靠的应用平台 。HACMP可用来最多将32部RS/6000服务器或SP的节点连结成高可用性的群集结构。对于企业关键性的应用程序而言,群集式的服务器或节点提供代理式的数据访问,具备复制性(redundancy),使得系统应用程序具有灵活的容错能力。HACMP所具有灵活的结构和简单的使用。从单一处理机(SMP)主机到SP节点皆可结构成高可用性之群集,您可混用,且跨越系统大小及性能等级,将各种网络适配卡和磁盘子系统融合在一起确 ,来满足您的应用程序、网络等方面的需求。HACMP的群集因不同的处理需求可以结构成几种不同的模式。同时访
4、问模式(Concurrent access mode)适用在所有处理机必须在相同的工作负载及在相同的时间共享相同的数据之环境。相互备援模式(mutual takeover mode)则是群集中的各个节点分别承担有应用和任务 ,并且各节点间相互备援。而热待机模式则为一节点备援任何群集上的另一节点。无论您选择哪一种备援模式,HACMP所提供的数据访问及备援方案都将应用程序的执行及增长性在避免不正常死机状况下做了最佳化处理。HACMP用户界面相当简易,AIX的系统管理界面工具(SMIT)及视觉化系统管理(VSM)图形使用界面两者皆提供非常简易的方式,给予您在高可用性的集群中针对服务器处理机执行安装、
5、结构及系统管理工作。对于一般的群集管理工作【例如HACMP启动/停止 、用户及群集管理、卷组、逻辑卷(Logic Volume)及文件系统】,您可以使用群集单点控制(CSPOC)工具来执行这些工作,即使是二个节点之群集,您完全无需考虑群集资源的所有权。并且借助于HAView功能,您可使用Tivoli的TME 10中的NetView for AIX图形网络管理界面由单一节点来监控群集及它的元件。可使用HACMP来处理以下几件事:l 针对许多企业关键的应用程序,建立高效益的群集环境。例如:针对在场顾客的零售、即时银行、电信业务、数据处理或其他特定交易信息处理的应用程序。l 建立一个更复杂的群集使其
6、高达八个节点,执行相同的应用程序且共享相同的资源,而仅有极小的损坏后重新启动的延迟。l 执行升级及维护确保您的系统没有毁损之虞。l 籍由AIX逻辑卷册管理员(LVM)磁盘镜射功能来改善磁盘的可靠性。二 :HACMP 的规划 群集的规划不仅仅包括在群集中所要使用的硬件类型 ( CPU、Networks 、disks ) ,也包括其它方面的规划 , 如 :资源的规划 - 在故障情况下所希望的群集的表现以及应用的考虑等 。 1 :群集节点HACMP 支持所有 RS / 6000 系列产品(单处理器 、多处理器服务器以及 SP 并行机),一个 HACMP 群集现在最多可由 32个 RS / 6000
7、服务器组成,这些服务器称为群集节点。群集节点及网络客户端通过一个或多个网络相互连接,每连接一个网络群集节点需要 2 块网卡,第一块网卡,即网络客户端连接的网卡,称做为“服务/Service”网卡,第二块网卡称做为“待机/Standby”网卡,用来在“服务”网卡失效时接替其工作。任何 RS / 6000 服务器都能做 HACMP 群集的群集节点,在一个群集中的群集节点没有严格的匹配要求。在选择 Cluster Node 时 ,主要是根据用户的应用和数据以及在故障接管后的性能表现来选择每个系统的 CPU 和最小配置 ,而且由于每种类型的机器所提供的I / O 扩展槽数不同 ,为了将来连接多个网络
8、、扩展共享磁盘以及消除网卡 、I / O 适配器等方面的单点失效问题 ,应有足够的 I /O扩展槽去提供冗余 。一般来说 ,一个节点对于它所连接的每一网络最多可有 7 块 standby 适配器卡 。下图是一个HACMP群集的示意图。表 1 是当前支持HACMP群集的RS/6000服务器的列表。 表 1 1需要AIX 4.3.2支持。HACMP和AIX本身对群集节点的最小要求为16M内存和400M硬盘,真正的需求取决于群集节点上的应用。 表 2 为 每种RS / 6000 产品所支持的 I / O 扩展槽数 。2 :群集网络HACMP群集支持两种类型的网络 :TCP / IP 网络和非 TCP
9、/IP网络,它利用这两种网络交换“心跳”信息,来诊断群集中是否出现失效。非 TCP / IP 网络用来将真正的硬件失效从由于 TCP/IP 软件失效而引起的系统失效中区别开来。如果只使用 TCP/IP 网络,当 TCP/IP 软件失效时,引起“心跳”停止,HACMP将错误地诊断为群集节点失效,而此时群集节点仍正常工作。通常 ,在节点间所有的网络也用于检查 、同步 、通讯及触发事件 。HACMP支持以下TCP/IP网络类型:l Ethernetl Token-Ringl ATMl FDDIl SLIPl FCSl SP Switchl SOCCl Generic IPHACMP For AIX在
10、标准以太网接口(en)上经过了测试,但在IEEE 802.3 以太网接口(et)上没有经过测试。HACMP 在每个群集中支持 32 个网络,每个群集节点上最多可以有 24 个 TCP/IP 网卡。这些对于网络配置提供了很大的灵活性 。每一种类型的网络接口都有不同的特性 ,如 :speed 、ARP 等,当使用某种适配器时,需要知道其特性 ,在 HACMP 中一般考虑 :Hardware Address Swap - 如果计划在群集中配置硬件地址交换,则所选择的网络适配器应支持此功能 。网络速度、距离及在同一物理网上的适配器个数是另一个考虑的因素 。如 :Ethernet - 支持 10 / 1
11、00 Mbps 和硬件地址交换 ,同一物理网上的适配器个数限制为 29 个 。FDDI - 是 100 Mpbs 的光纤网 ,也支持硬件地址交换 。ATM - 是 155 Mbps / 625 Mbps 点到点连接网络 ,不能使用硬件地址交换 ,在 HACMP 中它必须做为 “ private “ 网络来配置 。非 TCP/IP 网络在群集节点间作为一条专用通路用于互换讯息和“心跳”,以区别网络故障与节点故障 。建议在群集节点间至少使用一条 non-TCP/IP 连接 。HACMP支持以下类型的非TCP/IP网络类型:l Serial(RS-232)l Target-Mode SCSIl Ta
12、rget-Mode SSA所有以上非TCP/IP网络类型都必须在HACMP配置”Network Type”定义中定义为Serial。Serial (RS-232) :每个群集节点在有一个串行网络时需要一个串行端口;若一个群集内有两个以上的群集节点,串行网络要把所有群集节点连成一个环,这时每个节点需要两个串行端口。Target mode SSA :当使用共享SSA设备时,在HACMP中可用Target-Mode SSA作为串行网络。为了使用Target-Mode SSA,必须使用增强的RAID-5卡(#6215或#5219),卡的微码水平必须高于1801。表 3 为各种可能的群集节点支持的串行端
13、口数量。 表 3 1 - 串行端口可以通过双端口电缆复用,从而提供两个端口;2 - S7x类型的群集节点,没有串行端口,需另外的多端口串行卡;3 - 只有一个串行端口可为用户来配置HACMP。 Target mode SCSI :当使用共享SCSI设备时,可以利用SCSI总线交换“心跳”信息。Target-Mode SCSI仅支持差分SCSI-2和差分Wide/FAST SCSI-2设备,HACMP串行网络不支持SCSI/SE及SCSI-2/SE设备。在一个群集中,不推荐使用超过4个Target-Mode SCSI网络。 HACMP中网络分做公共网络、私有网络和串行网络。公共网络用于在群集节点
14、之间通信和与网络客户端通信,通常是TCP/IP网络;私有网络仅用于群集之间通信,网络客户端不能访问,它主要用于在”Concurrent”访问工作时,群集的“加锁”管理员通信,它可以是任何网络类型;串行网络仅用于“心跳”信息交换。从下图所示的HACMP图形中可以看到,HACMP上的TCP/IP网络有三个接口,Service、Standby和Boot,实际上是两块物理网卡,Service、Boot在一块物理网卡上,Standby在另一网卡上。三个接口定义三个IP地址,Service地址用于群集节点之间相互通信和节点与网络客户端之间相互通信;Boot接口是Service接口的临时定义,在其上定义Bo
15、ot地址,Boot地址是系统启动时Service网卡的临时地址,它仅仅当其节点失效而其地址被接管后才需要;Standby地址随时准备接管群集中任何节点上Service地址的失效。Service地址和Boot地址在一个逻辑子网上;Service地址和Standby地址一定在不同逻辑子网上。3 : 群集磁盘HACMP群集支持SSA和SCSI磁盘系统。1SSA 磁盘SSA是一种开放的工业标准,它是一种将主机适配卡与硬盘设备连接起来的高性能串行互连技术。SSA 磁盘子系统将适配卡和磁盘连接在一个环内,能提供 80M 的存取速度。下图是 SSA 的示意图。图中,一块SSA适配卡控制着由8块磁盘组成的环,
16、数据可以沿着环在双向传输,峰值传输速率可以达到80Mbps。一块SSA适配器卡提供两个SSA节点,可以提供两个环。在RS/6000中有两种SSA磁盘子系统:7131SSA Multi Storage Tower Model 405;7133SSA Disk Subsystem Models 010 、500 、020 、600、D40 和 T40 。7133 model 010 和 500 是早期(1995 年)的产品,D40 、T40 是较新的产品 。每个机箱最多包含 16 个SSA 磁盘(8 个在前面、8 个在后面),内部每 4 个相邻的磁盘连接成一串 ,这些串能够彼此相连 。如图 4 所
17、示 :图 4 : SSA 支持热拔插 ,在系统不关电的情况下可进行SSA磁盘、电缆等部件的更换 。在每个 SSA机箱的背部有 4块 “ bypass “ 卡 ,每块卡上有一对连接器用于连接外部 SSA 电缆或磁盘 。bypass 卡通过改变跨接位置能够被设置为 : . Automatic mode . Forced Inline mode 当 bypass 卡是操作在 Automatic mode ,它检测这两个外部连接器,若至少有一个连接器是连接到 power-on SSA 部件或设备,则它转换到 Inline state - 连接内部SSA环到外部连接器;如果它检测到这俩个外部连接器都没有
18、连接到 power-on SSA 部件或设备,则转换到 Bypass state - 连接内部SSA串,断开与外部连接器的连接 。当 bypass卡是操作在 Forced Inline mode,它不能实现转换 。下表为7131磁盘子系统的配置信息。下表为7133 SSA磁盘子系统的配置信息。下表为RS/6000上SSA适配卡的配置信息。 SSA 环路的连接非常的灵活,并有许多的限制 ,如 : . 最多可有 3 个仿真磁盘相互连接在同一 SSA 环中 。 . 连接俩节点间的SSA 电缆最大允许长度为 25 米,光缆为10 千米 。 . 在同一 SSA 环中最多能接 48 个磁盘 。 . 若在同
19、一 SSA 环中使用 SSA 4 Port Adapter (FC 6216) , 则只能连接 2 个 Adapter 。 下面是 SSA 的一些连接图 :这是最简单的配置,4个磁盘通过连接器 1 和 4 连到使用系统的一对连接器。这是较大的配置,为了平衡子系统,建议磁盘分成两组,连接成两个独立的环。 这是 16 个磁盘的最大配置 ,同样为了平衡子系统,建议磁盘分成两组,连接成两个独立的环。下面是 Multiple Unit 的配置 :在这个图中包含有 6 个 7133-unit ,共 96 个磁盘,分成两组独立的环连接到系统。下面是高有效性的配置 : 在高有效性的配置中,同一环内有多个SSA
20、 卡,通常可以得到好的性能;但在配置中应防止磁盘的隔离。如下图 : 在这种配置内,一个SSA环含有 4 块 SSA 卡,每个系统两块,1 和 2 在系统 1 上, 3 和 4 在系统 2 上,磁盘 13 16 是连接到同一系统的两块SSA卡上,如果这两块卡出现故障或复位 ,但保持加电状态,磁盘 1 12 还能够使用系统 2 进行访问,而磁盘 13 16 不能被系统 2 访问 ,因为它们的数据通路是通过系统 1 的SSA 卡,并且当系统 1 reboot 时 ,磁盘 13 16也长时间保持无效 。 7133 SSA磁盘子系统只能提供RAID-5,RAID-0和RAID-1可以通过逻辑卷的条带化和
21、镜像技术实现。由于RAID-0不能提供数据的冗余,在共享的磁盘系统上存在着单点失效的可能性,因此在7133 SSA磁盘子系统上可以配置RAID-1和RAID-5。RAID 1是通过镜像技术实现的 ,与 RAID 相比,占用的磁盘空间较多 ,但提供高可靠性的数据冗余,如果多个磁盘损坏时,还可存取到全部数据。而 RAID 5 当多于一个磁盘损坏时意味着数据丢失 。若使用 RAID 则 SSA 环最多只能有两个 SSA 适配器 ,RAID阵列由 3 16 个磁盘组成,且必须在同一环上。下表为RAID技术的优缺点对比情况。SSA技术有以下优点:l 双设备访问通道;l 电缆连接简单,不需要终结器;l 更
22、快的访问速度;l 可以实现对设备的并发存取;l 不需要想SCSI那样的仲裁机制;l 热插拔的电缆和磁盘;l 每个SSA适配器卡提供了非常高的容量,高达127个设备可以在一个SSA环中;l 设备之间的距离用铜缆时可以长达25米,用光纤可以达到10公里;l 自动配置,不需要手工设置设备号;l SSA是一个开放的标准。2SCSI磁盘在SSA磁盘子系统发布之后, SCSI磁盘子系统已很少在HACMP高可靠性群集系统中使用。但7135等SCSI RAID磁盘子系统仍在许多商业场合应用。由于电缆长度的限制,HACMP系统在共享的SCSI总线上最多支持2个7135磁盘子系统。在HACMP群集中,在共享的SC
23、SI总线上能够用来连接RAID磁盘子系统的SCSI卡有以下几种型号:l SCSI-2 Differential Controller(微通道总线,FC:2420)l SCSI-2 Differential Fast/Wide Adapter/A(微通道总线,FC:2416)l Enhanced SCSI-2 Differential Fast/Wide Adapter/A(微通道总线,FC:2412)l SCSI-2 Fast/Wide Adapter Differential(PCI总线,FC:6209)l DE Ultra SCSI Adapter(PCI总线,FC:6207)7135 S
24、CSI磁盘子系统有以下特点:l 支持RAID-1、RAID-3、RAID-5;l 多逻辑单元(LUN)支持;l 冗余电源及冷却系统。4 :资源规划HACMP 给客户端提供高可用性的资源环境,当HACMP集群中的节点失效或按正常程序退出群集时,群集管理器将重新在剩余的节点中分配资源。在HACMP中定义了以下资源类型:l 卷组l 磁盘l 文件系统l 要”Mount”到“网络文件系统”上的文件系统l 要”Export”到“网络文件系统”上的文件系统l Service IP地址l 应用程序(1) 资源组群集中的每个资源被定义为资源组的一部分,这样做可以将有关联的资源聚集在一起,以提供特殊服务;同时,资
25、源组还包括能够获得资源及提供这些资源到客户端的节点列表 。有三种类型的资源组:l Cascading l Rotating l Concurrent每种类型的资源组描述了节点在群集中的不同关系类型,及节点进入或离开群集的不同表现。Cascading资源组中的节点设置优先等级,优先级最高的节点是活动节点,控制着整个资源组。当优先级最高的节点失效时,次高优先级的节点控制资源组;当优先级最高的节点重新加入群集时,它将重新获得对资源组的控制权。Rotating资源组涉及的不是连接某一个节点,而是和多个节点都有能力采用的共享的IP地址相联系,当定义了共享适配卡的第一个节点加入群集时,它将获得和共享IP地
26、址相关联的Rotating资源组。当控制Rotating资源组的节点离开群集时,下一个存在的节点获得该Rotating资源组;当该节点重新加入群集时,它将处于待机状态,而不重新获得该Rotating资源组的控制权。Concurrent资源组能被多个节点同时共享,当一个节点失效时,没有任何接管工作发生;当失效节点重新加入群集时,它将和其它节点同时访问Concurrent资源组。对于上述三种资源组分别可用一句话来进行概述 : Cascading - 活动节点使用最高优先级控制资源组 。 Concurrent - 所有活动节点可访问资源组 。 Rotating - 节点使用 rotating res
27、ource 组的相关的 service IP 地址来控制资源组 。(2) :共享的逻辑卷 在设计群集时需考虑是否需要配置非同时访问磁盘和同时访问磁盘的环境 。(一) :非同时访问磁盘的配置 非同时访问磁盘有以下配置方式: . Hot-Standby . Rotating Standby . Mutual Takeover . Third Party Takeover 下面的图为Hot Standby 配置方式,在这种配置中,定义了一个 cascading资源组,包含 4 个磁盘,构成卷组和文件系统。对于这个资源组,节点1 的优先级是1 ,节点2 的优先级是2 ,在正常操作期间 ,node 1
28、给用户端提供所有的主要服务,node 2 提供非主要的服务或处于 standby 状态 ;当 node 1 出现故障或退出群集,node 2 获得资源组且提供主要服务 ;当 node 1 重新加入群集后,由于 node 1 的优先级高于 node 2 , node 2 释放它所接管的资源,重新回到 standby 模式 ,node 1接管回资源组 。 这种配置的优点是 node 2 可选一配置较低的节点,但发生接管后性能将受到一定的影响 。下图为Rotating Standby配置方式。在这种配置中,除使用 Rotating资源组外,其它与 Hot Standby 类似 ;不同点为当故障节点重
29、新加入群集后,不发生资源接管 ,而成为 Standby node 。因此在这种配置中 ,应使用相同性能 、配置的节点 ,与 Hot Standby 相比 ,可提供较好的可靠性和性能。 下图为Mutual Takeover配置方式。在这中配置中,定义了两个资源组 :A 和 B ,node 1 对于资源组 A 的优先级为 1 ,对于资源组 B 的优先级为2 ;node 2 对于资源组 B 的优先级为 1 , 对于资源组 A 的优先级为 2 ;在正常操作期间 ,node 1 和 2 分别控制着资源组 A 和 B ,都给客户端提供主要服务 。如果其中某一节点出现故障或退出群集,剩余节点接管其资源继续给
30、客户端提供服务 ;当故障节点重新加入群集后,将接管回它所控制的资源组 。 下图为 Third Party 接管的配置方式 。这种配置定义的资源组与相互备援的配置相同 ,定义了两个资源组 :A 和 B ,node 1 对于资源组 A 的优先级为 1 ,node 2 对于资源组 B 的优先级为 1 ;所不同的是定义了第三个节点 ,它作为这两个节点的备援节点 ,对于资源组 A 和 B 有相同的优先级 2 。在正常操作期间 ,node 3 处于 Standby 状态或提供非主要的服务 ,如果其中某一节点出现故障或退出群集,节点 3 接管其资源继续给客户端提供服务 ;当故障节点重新加入群集后,将接管回它
31、所控制的资源组 。这种配置方式消除了在 Mutual Takeover 中由于发生接管而引起的性能下降问题 。以下为三节点群集示意图 :(二) :同时访问磁盘的配置 同时访问磁盘的配置 ,通常是所有的磁盘都定义为 Concurrent 资源组的一部分 ,与Concurrent 资源组相关的节点无优先级之分 ,当群集中某一节点出现故障时 ,发生的接管不明显 ,因为 Concurrent 资源组已经在群集中的其它节点上活化了。 下图为同时访问磁盘的配置示意图 :( 3 ) : IP地址接管IP地址接管的目的是保证服务器的服务地址(Service地址)的高可用性,以保证网络客户端能以此相同的地址一直
32、保持与网络的连接。为了确证IP地址接管的实现,必须定义:l 群集中使用的网络类型l 网络的拓扑结构l 每块网卡的IP地址,包括Service地址、Standby地址、Boot地址和网络掩码l 为 service 网卡定义一个交替网卡硬件地址,以便在IP地址接管时实现硬件地址的替换 ( 一 )网络的拓扑结构 是采用单网络结构 、双网络结构还是点到点的连接类型 。 如果采用单网络结构 ,在这种配置中 ,群集中的每一个节点仅连接到一个网络 ,对客户端来说仅一块 service 卡是有效的 ,若 service 网卡出现问题 ,其备援的 standby 卡将获得它的 IP 地址 ,继续为客户端提供服务
33、 ,然而当网络本身出现问题时 ,该网络结构出现了单点失效 。下图为单网络结构示意图。 任一节点的Service地址失效时,其节点上的Standby地址 将接替失效的Service地址。但当网络失效时,该网络结构 将出现单点失效。如果采用双网络结构 ,在这种配置中 ,每个群集节点上有两块服务网卡,连接于两个不同的网络 ,对网络客户端来讲有两个 Service 地址,当一个网络失效时,另一个网络还在正常工作,使该节点继续给网络客户端提供服务。从而避免了由于网络故障而出现的单点失效 。下图为双网络结构示意图 点到点的连接是相邻的群集节点直接互连 ,SOCC 、SLIP 、ATM等都是点到点的连接类型
34、 。下面是一个采用单网络结构的示意图 ,在群集中两节点间连接了一条专用线路 ,当 public 网络出现故障时 ,在节点间提供一替代的通路 。 ( 二 )网络在 HACMP 群集中 ,每一个网络是由网络的名字和属性定义的 。网络名 - 在 HACMP 环境中网络名是用于标识网络的符号值 ,群集进程使用此信息去确定哪一块 adapter 是连接到了相同的物理网上 。如果多个adapter 共享同一物理网 ,当定义这些 adapter 时应使用相同的网络 。属性 - 区别该网络是 Public、Private 还是 Serial 。 Public - 一个 public 网络可连结 2 32 个节
35、点 ,并允许客户端去检测和存取群集节点 。Ethernet 、Token-Ring 、FDDI 、SLIP 等都被认为是public网络 ,但 SLIP 不提供客户端的存取 。 Private - 仅在节点间提供通信 ,不支持客户端的存取 。Serial - 这个网络特性仅用于 “ non TCP/IP “ 网络 。 ( 三 )网络适配器网络适配器用于连接节点到网络 ,在 HACMP 中 ,节点每连接一个网络 ,至少要有两块网卡 :service 和 standby ,如果定义了 IP 地址接管 ,则这块 service 网卡也必须定义一个 boot 地址 。每个节点所允许的最大的网卡个数是
36、24 。在 HACMP 中,网络适配器是由其标记、功能定义的。标记( label ) - 即为 /etc/hosts 文件中与IP地址相对应的名字,那么,一个单独的节点可以分配几个 label 和 IP 地址 。功能 ( function ) - 描述该网卡在 HACMP 中是Service、Standby及Boot。Service 适配器 : 是在节点与网络之间的主要连接,一个节点对于它所连接的每一物理网都有一个 service 网卡。standby适配器 : 是 service adapter 的备援。如果 service 网卡出现故障时,群集管理器使用 service 网卡的 IP 地址
37、替代了 standby 网卡的地址 ,从而消除了网卡故障所引起的单点失效 。对于所连接的每个网络 ,节点可以不要 standby 网卡或有 1 7 个网卡 ,根据所配置的软件和硬件插槽而定。在同一系统上 ,standby adapter 与 service adapter 应配置为不同的子网。Boot 适配器 :如果在群集中定义了 IP 地址接管 ,允许一个节点去获得群集中其它节点的网络地址 ,在群集节点上 ,一个 boot adapter 地址必须分配给 service adapter ,也可以说 boot 地址是 service adapter 的第二个名字和 IP 地址 。在一个节点 r
38、eboot 之后以及 HACMP 启动之前使用这个 boot 地址 ,当 HACMP 软件在节点上启动之后 ,service adapter 使用service IP 地址替代 boot 地址而重新被配置 。( 四 ) 定义硬件地址网络硬件地址的替换是与 IP 地址接管合作使用的 ,它能够维持 IP 地址和硬件地址的绑定,当发生 IP 地址接管时,将不必要进行网络客户端 ARP缓存的刷新。5 :应用系统规划在 HACMP 内组合节点的中心目的是为了给用户的重要应用和数据提供高可用性的环境 ,为了将应用系统置于HACMP的控制之下,需定义“应用服务器”这样一个群集资源,应用服务器是书写的Scri
39、pt,在其中定义了启动和停止应用系统的命令及路径 ;当接管发生时 ,HACMP 能够在接管节点上启动应用。为了规划应用 ,必须要对应用比较了解 ,如 :需要多大的磁盘空间 、用户怎样访问应用等 ;还应该清楚应用是否需要 license ,应用系统的“许可证”是HACMP中必须考虑的问题,有时它是基于CPU的,当主应用节点发生失效时,另一节点接管过去,但没有应用系统的“许可证”系统也没法正常工作。有两种方法解决这一问题,一是采用“浮动许可证”,另一是购买“节点锁定许可证”。还应考虑的一个因素是在接管发生后 ,一个节点将要同时运行几个应用,必须保证应用数据或资源不能彼此间相互冲突 。注意 :应用服
40、务器文本在同步期间不被传输 ,在主节点和接管节点上应保持其有相同的路径和权限 。6 : 用户 ID 规划 对于 HACMP 用户 ,系统管理员必须在群集节点上产生相同的用户帐号 ,用户信息也必须保持一致 ,这样,当群集节点出故障时,用户能够 login 到其它节点而无需考虑由于 UID / GID 不一致所引起的问题 。用户的 home directory 在群集节点上也应具有相同的路径和权限 ,以保证用户能够方便的存取到他们自己的文件 。. 可以把 home directory 建在共享卷组上。. NFS Mount home directory 。 使用此方法时,但当 NFS Server
41、 有问题 ,对 home directory 的 存取将被拒绝 。. NFS-Mount 共享卷组上的 home directory 这是一种组合方法,把 home directory 作为资源组的一部分且放在共享卷组上 ,所有的群集节点能够存取 。三 : HACMP 的安装与配置 在安装 HACMP 软件之前 ,应首先安装AIX操作系统、配置网卡、设置共享卷组及编辑AIX配置文件 。(1) AIX的准备为了安装HACMP,AIX必须处于相对应的状态。下表为HACMP的各种版本对AIX的需求。安装HACMP的部件HAVIEW 4.2时需要安装:xlC.rte 3.1.3.0nv6000.bas
42、e.obj 4.1.0.0nv6000.database.obj 4.1.0.0nv6000.Features.obj 4.1.2.0nv6000.client.obj 4.1.0.0安装HACMP的部件HAVIEW 4.3时需要安装:xlC.rte 3.1.4.0nv6000.base.obj 4.1.2.0nv6000.database.obj 4.1.2.0nv6000.Features.obj 4.1.2.0nv6000.client.obj 4.1.2.0为了使群集中的每个节点都能够求解地址,在每个节点上,编辑/etc/hosts文件,确保群集内的所有的接口的IP地址都列在里面。如果
43、使用了域名求解配置,则编辑 /etc/resolv.conf 文件 。下面是/etc/hosts文件的示例:下面是 /etc/resolv.conf 文件示例 :编辑/.rhosts文件,确保群集中每个节点的服务网卡和Boot地址都列在里面,这样做的目的是为了能够运行/usr/sbin/cluster/utilities/clruncmd命令和执行/usr/sbin/cluster/godm进程。当以一个节点为中心配置整个群集时要用到/usr/sbin/cluster/godm进程。同时,在群集同步和检测功能使用 rcmd 、rsh命令要用到 /.rhosts 文件 ,若使用 C-SPOC 命
44、令也需要此文件 。在不需要时 ,为了安全的原因应删除 。下面是/.rhosts文件的示例:(2) 网络的连接与测试在网络的连接配置中,给系统中的每一块网卡分配相应的IP地址 ,但是要注意 ,standby 网卡与 service 网卡应在不同的子网上。可以使用 AIX提供的系统管理工具 smit 去配置相应的网卡,在配置完成之后,能够使用 AIX 命令检测 TCP/IP 子系统是否正常工作 。n 使用 ping 命令检查两节点间点到点的连接 。n 在所有 adapter 上使用 ifconfig 命令去检查是否有不正确的 IP 地址、子网掩码和广播地址 。n 使用 lssrc g tcpip
45、命令去确定 inetd daemon 是运行的 。n 使用 lssrc g portmap 命令去确定 portmap daemon 是运行的 。n 使用 arp 命令去确定群集中的节点没有使用相同的 IP 和硬件地址。 使用 smit tty 命令在节点上产生一个 tty 设备 ,注意 Enable login field 应设置为 disable 。在配置完之后也应测试其功能 ,可以使用下列命令从一设备上写而从另一设备上读 : cat /dev/ttyy - 在另一设备 /dev/ttyy 上写 。 应能够看到,在键入第一个命令后处于等待状态直到第二个命令被键入,才显示它的输出 。(3)
46、群集磁盘的配置 对于群集磁盘的配置,以SSA 为例来说明。 SSA 磁盘在AIX 系统中的配置 在系统 boot 期间,AIX配置管理器配置所有 available 的设备,当SSA 子系统没有连接或SSA 软件没有安装时,则不能配置。配置管理器将配置以下设备:. Adapter Router (ssar)ssar 仅是概念上的配置帮助且总是定义为“Defined “状态,不能改变其为“Available“,使用下面的命令可显示 ssar 。 # lsdev C |grep ssar ssar Defined SSA Adapter Router . Adapter 定义 使用下列命令,可以检查正确的适配器配置 。这个适配器必须处于“Available“状态 。#lsdev C|grep ssa ssa0