《AIX5.3hacmp5.3双机互备配置.pptx》由会员分享,可在线阅读,更多相关《AIX5.3hacmp5.3双机互备配置.pptx(30页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、AIX_5.3+hacmp5.3双机互备配置概述HACMP是HighAvailabilityClusterMulti-Processing的缩写。HACMP是IBM公司在P系列AIX操作系统上的高可靠集群软件,配置冗余,消除单点故障,保证整个系统连续可用性和安全可靠性。HACMP是利用网络来侦测主机及网卡的状况,搭配AIX所提供的硬盘镜像等功能,在主机、网卡、硬盘控制卡、硬盘或网络发生故障时,自动切换到另一套备用元件上重新工作;若是主机故障还切换至备份机上继续应用系统的运行。HACMP提供两种节点故障的处理方式:磁盘接管IP地址接管2工作原理作为双机系统的两台服务器同时运行HACMP软件;两台
2、服务器的备份方式有三种:a)一台服务器运行应用,另外一台服务器做为备份b)两台服务器除正常运行本机的应用外,同时又作为对方的备份主机;c)两台服务器同时运行相同的应用,需要数据库的支持。p两台主机系统在整个运行过程中,通过心跳线相互监测对方的运行情况(包括系统的软硬件运行、网络通讯和应用运行情况等);一旦发现对方主机的运行不正常(出故障)时,故障机上的应用就会立即停止运行,本机(故障机的备份机)就会立即在自己的机器上启动故障机上的应用,把故障机的应用及其资源(包括用到的IP地址和磁盘空间等)接管过来,使故障机上的应用在本机继续运行;应用和资源的接管过程由HACMP软件自动完成,无需人工干预;当
3、两台主机正常工作时,也可以根据需要将其中一台机上的应用人为切换到另一台机(备份机)上运行。心跳设置pTCP/IP网络优点:要求低,不需要任何额外硬件或软件,即可实现。缺点:占用ip地址,不能避免由于TCP/IP的软件问题导致HACMP崩溃,系统不可用。p串口网络优点:真正实现高可用性,不占用IP地址。缺点:需要硬件支持,对于p5机器,需要新增异步卡,而中低端的机器的插槽有限。p 磁盘心跳优点:不占用插槽,磁盘总线上的心跳网络能够在TCP/IP网络资源有限的情况下提供额外的HACMP节点间的通信手段,并且能够防止HACMP节点之间由于TCP/IP软件出现问题而无法相互通信。缺点:需要操作系统和存
4、储支持,如使用增强型卷组,此外对于I/O读写的应用,也需要慎用。正如IBM红皮书所说,条件许可的情况下,强烈推荐使用串口网络,其次是磁盘心跳。安装前的准备工作本PPT所提及的node1和node2分别表示安装HACMP的两台p5服务器,本例中采用磁盘方式做心跳,共享资源为共享磁盘,运行的服务为一个简单的写入脚本。1.配置两台机器的ip地址Smittcpip设置一台机器的两个网卡ip地址为:和给eth0网卡添加一个服务网址即虚拟ipifconfigen0192.168.9.101netmask255.255.255.0alias(将该命令添加到/etc/系统重启后虚拟ip也生效)另一台机器也同样
5、配置()2.配置/etc/hosts文件(两台机器相同)3.添加心跳磁盘设置两块网络共享磁盘或磁盘阵列进行添加Smit-devices-iscsi-iscsitargeideviceparametersinODM-AddaniSCSITargetDeviceinODM-AddaStaticallyDiscoverediSCSITargetDeviceinODM4.添加共享磁盘同样步骤添加第二块磁盘添加后需要设置该磁盘为共享数据存储区prodvgmkvg-ypdavghdisk4mklv-yptlvpdavg128crfs-vjfs-m/database-dptlvmount/databasec
6、hvganpdavg最后要在这台机器执行:varyoffvgprodvg来停止这个共享卷组。p换到另一台机器,用#smittyimportvg来导入这个共享卷组,输入卷组的名字:pdavg;选择硬盘:hdisk13(因为在erp这台机器有多个硬盘,看PVID号得出hdisk13是共享的数据盘)导入pdavg后,我们在这台机器也要改变VG的属性。chvganpdavg要把重启系统后自动激活卷组改为NO。varyoffvgpdavg安装系统补丁AIX5.3系统安装时只安装一些基本的软件包(fileset),而有些软件包是用户经常用到的但没有被安装。建议用户在安装完AIX5.3系统后再安装以下一些软
7、件包。patbos.adtbos.sysmgt将AIX操作系统的第一张CD插入CD-ROM驱动器,使用如下命令挂载mountvcdrfsoro/dev/cd0/mntpsmittyinstall_all,在Inputdevice/directoryforsoftware选项中输入/mnt,按F4将上述软件包选上安装,将ACCEPTnewlicenseagreements?选择为yes安装p安装需要的系统补丁(530000需要530008不需要,可以根据安装hacmp的提示信息进行补丁安装)8安装HACMP将HACMP V5.4 光盘放入光驱中进行HACMP 的软件安装安装HACMP安装盘中的文
8、件,按F7将下面的软件包选择:cluster.adt.escluster.es;cluster.es.cfs;cluster.es.cspoc;cluster.es.plugins;cluster.license;cluster.man.enus.es选完后按回车返回至安装界面,然后将是否同意新许可改为YES,并回车开始安装软件。p安装后对hacmp进行升级查看/etc/inittab文件分别查看2个机器上的/etc/inittab文件的最后几行是否包含以下部分:clcomdES:2:once:startsrc-sclcomdES/dev/console2&1主要用于启动ClusterComm
9、unicationsDaemon(clcomd),这也是在配置HACMP时,运行自动发现过程所需要的。10 编辑环境变量p两台机器都要做/etc/environmentPATH=/usr/bin:/etc:/usr/sbin:/usr/ucb:/usr/bin/X11:/sbin:/usr/java14/jre/bin:/usr/java14/bin:/usr/sbin/rsct/binTZ=BEIST-8LANG=en_USLOCPATH=/usr/lib/nls/locNLSPATH=/usr/lib/nls/msg/%L/%N:/usr/lib/nls/msg/%L/%N.catLC_F
10、ASTMSG=truep修改PATH环境变量:将/usr/es/sbin/cluster和/usr/es/sbin/cluster/utilities加入PATH环境变量中,这样可以在命令行中使用HACMP自带的工具。11建立集群smittyhacmp-ExtendedConfiguration-ExtendedTopologyConfiguration-ConfigureanHACMPCluster-Add/Change/ShowanHACMPClusterAdd/Change/ShowanHACMPClusterEntryFields*ClusterNametest_cluster12添加
11、节点smittyhacmp-ExtendedConfiguration-ExtendedTopologyConfiguration-ConfigureHACMPNodes-AddaNodetotheHACMPClusterAddaNodetotheHACMPClusterEntryFieldsNodeNamenode1CommunicationPathtoNodeboot1以相同方法添加第二个节点node2。如果有多个节点,以此类推。13创建并发卷组做磁盘心跳14smithacmp-SystemManagement(C-SPOC)-HACMPConcurrentLogicalVolumeMan
12、agement-ConcurrentVolumeGroups-CreateaConcurrentVolumeGroup-Esc+7选上两个节点(心跳磁盘需将共享磁盘所在的卷组设为concurrent模式)测试并行卷组通讯15收集HACMP 相关信息smittyhacmp-ExtendedConfiguration-DiscoverHACMP-relatedInformationfromConfiguredNodes16添加网络HACMP的网络分为Discoverednetwork和Pre-definednetwork两种,如果之前有收集HACMP的相关信息,可选Discoverednetwor
13、k;否则,选择Pre-definednetwork。此处可以根据此集群采用的心跳方式选择相应的网络,包括ethernetwork、diskhbnetwork和rs232network。本例中我们采用磁盘方式做心跳。smittyhacmp-ExtendedConfiguration-ExtendedTopologyConfiguration-ConfigureHACMPNetworks-AddaNetworktotheHACMPCluster-AddanIP-BasedNetworktotheHACMPClusterEntryFields*NetworkNamenet_ether_01*Netw
14、orkTypeether*Netmask255.255.255.0+*EnableIPAddressTakeoverviaIPAliasesno+IPAddressOffsetforHeartbeatingoverIPAliases17添加通信接口smittyhacmp-ExtendedConfiguration-ExtendedTopologyConfiguration-ConfigureHACMPCommunication-Interfaces/Devices-AddCommunicationInterfaces/Devices-AddDiscoveredCommunicationInte
15、rfaceandDevices-CommunicationInterfaces-net_ether_01(192.168.1.0/24192.168.8.0/24)用Esc+7选上boot1stdby1boot2stdby218配置磁盘心跳网络smithacmp-ExtendedConfiguration-ExtendedTopologyConfiguration-ConfigureHACMPNetworks-ConfigureHACMPCommunicationInterfaces/Devices-AddCommunicationInterfaces/Devices-AddDiscovere
16、dCommunicationInterfaceandDevices-Communicationdevices-Esc+7选两个节点hdisk1019编辑起停脚本启动脚本/app/dbstart.shechostart/database/startdate/database/starthostname/data/start停止脚本/app/dbstop.shechostop/database/stopdate/database/stophostname/database/stop20添加应用服务smittyhacmp-ExtendedConfiguration-ExtendedResourceC
17、onfiguration-HACMPExtendedResourcesConfiguration-ConfigureHACMPApplications-ConfigureHACMPApplicationServers-AddanApplicationServerEntryFields*ServerNametest_app*Startscrpt/app/dbstart.sh*Stopscrpt/app/dbstop.shApplicationMonitorName(s)+此应用服务的启动和停止脚本就是之前在做准备工作时创建的那两个脚本。21添加服务IP smittyhacmp-ExtendedC
18、onfiguration-ExtendedResourceConfiguration-HACMPExtendedResourcesConfiguration-ConfigureHACMPServiceIPLabels/Addresses-AddaServiceIPLabel/Address-ConfigurableonMultipleNodesAddaServiceIPLabel/AddressconfigurableonMultipleNodes(extended)EntryFieldsIPLabel/Addressp1_svc1NetworkNamenet_ether_01Alternat
19、eHardwareAddresstoaccompanyIPLabel/Addressp同样添加第二个节点的服务ipp2_svc122添加资源组smittyhacmp-ExtendedConfiguration-ExtendedResourceConfiguration-HACMPExtendedResourceGroupConfiguration-AddaResourceGroupAddaResourceGroup(extended)EntryFieldsResourceGroupNametest_regParticipatingNodes(DefaultNodePriority)node1n
20、ode2+StartupPolicyOnlineOnHomeNodeO+FalloverPolicyFalloverToNextPrio+FallbackPolicyFallbackToHigherPr+23更改资源组属性将服务IP、应用服务、共享卷组和文件系统都加入到此资源组中smittyhacmp-ExtendedConfiguration-ExtendedResourceConfiguration-HACMPExtendedResourceGroupConfiguration-Change/ShowResourcesandAttributesforaResourceGroup24同步验证
21、配置并与集群中的其它节点进行同步:必须保证同步的结果是正确,如果有错误出现,请按照错误提示进行相应调试smittyhacmp-ExtendedConfiguration-ExtendedVerificationandSynchronization25启动hacmp在启动之前必须执行以下的命令#snmpv3_ssw-1(两台机器)Smitclstart(将两个节点node1和node2都选上)(将第3项informationdaemon改为true)启动HA后,可在命令行下用tailf/tmp/hacmp.out命令查看HA软件在启动过程中输出的信息,对于排查错误很有帮助。如成功启动完成,用ls
22、srcgcluster查看是否有如下输出:SubsystemGroupPIDStatusclsmuxpdEScluster516170activeclstrmgrEScluster741400active用lsvgo及psef|grep应用程序名命令查看是否VG、应用都已经启动 26关闭hacmpHA软件的关闭使用smitty工具菜单的快捷路径smitty clstop,出现如下菜单,默认为now,即立即关闭,在第二项StopClusterServiceonthesenodes选择希望停HA的节点,回车确认。hacmp启动/关闭的三种模式Graceful该节点释放资源但其他节点不会接管资源;G
23、racefulw/takeover该节点释放资源并且其他节点会接管资源;Forcedclustermanage被强行停止(clstmgr进程被杀死),但节点不释放资源,其他节点也不会接管资源。这样,用户就可用根据需要来手工使某个节点离开cluster。要注意的是,节点主动离开cluster与节点down后不得不离开cluster不是一回事。节点down掉后,该节点上的HACMP进程会自动停止,HACMP会自动使资源被接管。而节点被手工设置离开cluster时,是采用上面三种方式的人为使然,则视方式不同而有不同的特定行为。双机切换测试ifconfiga查看serverip拔掉p1的en0网线serviceip在node1的stdby网卡上插回p1的en0网线,拔掉p1的en1网线serviceip在p1的boot网卡上同时拔掉p1的两根网线,四分钟后serverip切换到p2的stdby网卡上可以telnentserverip用hostname查看同时插回p2的两根网线,先smitclstop再用smitclstart启动p1的hacmp,应用会回切到p6508c上的在host1上执行haltq,host1机宕机,切换到host2机29
限制150内