当集群中的某个节点由于软件或硬件原因发生故障时,集群系统可以把资源切换到其他健康的节点上,使整个系统能连续不间断的对外提供服务,从而为机构24x365的关键业务提供了可靠的保障,达到了系统99.999%的高可用性和可靠性。SuSE Enterprise Linux 10.0是内置Linux 2.6.16内核的企业级服务器,较之SuSE Enterprise Linux 9.0,它在性能、可扩展性、易管理性和安全等方面都予以加强,并有众多硬件和应用软件支持。
最近,笔者使用SuSE Enterprise Linux 10.0作为系统平台(使用其它Linux平台在安装部署时可能有小差异),在其上采用HeartBeat、Mon和Rsync等开源软件打造了一个高可用系统,挖掘了SuSE Linux的高可用性。下面我为大家详细介绍如何在Suse Linux搭建双机的配置过程。
虽然在 YaST2控制中心里有"高可用性"图形化的配置向导,我们这里不介绍一个过程,中在讲述原理和方法,主要是基于命令行的配置方式。首先在PC服务器上安装SuSE Enterprise Linux 10.0系统,并将eth0配置为192.168.8.*网段,eth1配置为10.1.1.*网段,eth0链接对外的交换机,eth1用于两台机器的对连。
chkconfig -s alsasound off chkconfig -s nfs off chkconfig -s nfsboot off chkconfig -s portmap off chkconfig -s slpd off chkconfig -s smbfs off chkconfig -s setserial off chkconfig -s splash off chkconfig -s splash_early off chkconfig -s splash_late off chkconfig -s xdm off chkconfig -s fbset off chkconfig -s cups off chkconfig -s nscd off chkconfig -s random off 最后,修改启动级别为3。找到/etc/inittab文件的如下几行:
#The default runlevel is defined here id:5:initdefault: 将其改为如下:
#The default runlevel is defined here id:3:initdefault:
#tar xvzf Time-HiRes-1.65.tar.gz #3cd Time-HiRes-1.65/perl Makefile.PL && make &&make test && make install 从www.kernel.org/software/mon/下载并安装软件包mon-0.99.2.tar.bz2:
Nov 2 17:15:59 linux mon[14079]: failure for www http 1099386959 10.1.1.1 Nov 2 17:15:59 linux mon[14079]: calling alert apacherestart.alert for www/http(/usr/lib/mon/alert.d/apacherestart.alert,) 10.1.1.1 Nov 2 17:16:03 linux mon[14079]: calling alert mail.alert for www/http(/usr/lib/mon/alert.d/mail.alert,song@heming.org) 10.1.1.1 邮件内容则如下:
ALERT www/http: 10.1.1.1(Tue Nov 2 17:16:03)(标题)
Sunmmary output : 10.1.1.1
Group : www
Service : http
Time noticed : Tue Nov 2 17:16:03 2004
Secs until next alert :
Members : 10.1.1.1
Detailed text (if any) follows:
HOST 10.1.1.1: connect: Connection refused
② 测试网络监控和警告