提高计算机网络可靠性的方法研究_张晓杰.docx
《提高计算机网络可靠性的方法研究_张晓杰.docx》由会员分享,可在线阅读,更多相关《提高计算机网络可靠性的方法研究_张晓杰.docx(5页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、提高计算机网络可靠性的方法研宄 张晓杰 u, 姜同敏 S 王晓峰 1 (1.北京航空航天大学工程系统工程系,北京 100191; 2.曙光信息产业有限公司产品设计中心,北京 100084) 摘要:为研宄提高计算机网络可靠性的方法,研宄建设高可靠计算机网络的途径,满足国民经济和社会生活对高可靠计算 机网络的需要,在简要介绍计算机网络发展现状的基础上,从工程实践角度总结出计算机网络的可靠性设计原则,并通过某 单位计算机网络的硬件设计实例,提出了完整的网络系统硬件可靠性设计方案。通过结合某研宄所计算机网络的软件设计实 例,提出了一套网络系统的软件可靠性设计方法。该可靠性设计技术对提高计算机网络的可靠
2、性设计水平具有参考价值。 关键词:计算机网络;网络可靠性;局域网络;服务器机群;防火墙系统 中图法分类号 : TP393.02 文献标识码 : A 文章编号: 1000-7024(2010)05-0990-05 Study on methods of improving computer-network reliability ZHANG Xiao-jie12, JIANG Tong-min1, WANG Xiao-feng1 (1. Department of System Engineering of Engineering Technology, Beijing University o
3、f Aeronautics and Astronautics, Beijing 100191, China; 2. Product Center, Dawning Information Industry Limited Company, Beijing 100084, China) Abstract: To satisfy the urgent demand for high-reliable computer network in the country, on the methods of improving the computer- network reliability and t
4、he ways to construct a reliable computer-network are researched. First, the computer-network status quo is briefly introduced. Then the computer-network reliability design principles in engineering practice are concentrated. Finally, by researching the computer-network design in a company and a rese
5、arch center separately, the network hardware and software design methods are es- tablished. The reliability design technology is used to enhance the reliability in the computer network. Key words: computer network; network reliability; local area network; cluster of server; firewall system 计算机网络产生于
6、20世纪 80年代 1 35, 90年代中期建立的 In- temet 就是计算机网络发展的辉煌成就。 21 世纪初提出了综合数字业务的第 4 代计算机网络一一 “ 三合一网络 (计算机网、电信网和广电网 )” 1, 3,5。近 3 年来,计 算机网络正在朝高可靠性和多综合业务的方向发展。 在计算机网络发展的进程中,一个重要里程碑就是 20 世 纪 80 年代出现的计算机局域网络 (local area network, LAN)4,6, 它使得一个或几个单位的个人计算机、工作站、数据和语音 通信设备、控制设备和安全设备连接起来,互相共享资源和 交换信息。 1980 年 2 月美国电气和电子工
7、程师学会组织颁 布的 IEEE 802 系列标准,对局域网的发展和普及起到了巨 大的推动作用。本文对可靠性的论述主要针对计算机局域 网展开。 2 计算机网络的可靠性设计准则 英国电气工程师学会曾发表论文指出: “ 在提供通信的英 国天网系统的设计研制中,中心课题首先是可靠性 ” 8。计算 机网络是应用系统的基础,实现了单位内部各部门间以及与 外单位的信息联系,网络系统在任何时间、任何地点发生的任 收稿日期: 2009-05-07;修订日期 : 2009-07-27。 作者简介:张晓杰 ( 1977 ),男,山西阳泉人,博士研究生,工程师,研究方向为系统可靠性工程;姜同敏( 1949 一 ),男
8、,北京人,教授,博 士生导师,研究方向为系统可靠性试验工程;王晓峰 ( 1964 ),男,黑龙江哈尔滨人,博士后,副教授,研究方向为系统的故障诊断。 E-mail: zxj2007- 0 引言 计算机网络能够始终如一地可靠工作,不受干扰和破坏, 可靠性日益成为计算机网络不同使用层次用户共同关心的核 心问题 m,可靠性也成为计算机网络的基本要求。探讨高可靠 计算机网络的设计准则,解决计算机网络的可靠性设计和建 设问题,确保计算机网络能够可靠地正常运行,具有较高的理 论和现实意义。 1 计算机网络概述 计算机网络是计算机技术与通信技术紧密结合的产物, 是通过数据通信系统把分布在不同地理区域,具有独
9、立功能 的计算机,通过功能完善的网络软件实现数据通信、资源共享 和协同工作的一种计算机系统。 计算机网络的发展历史可以追溯到 20 世纪 50 年代初产 生的面向终端的第一代计算机网络 15,它是以单台计算机为 中心的远程联机系统。第二代计算机网络是产生于 20 世纪 60 年代中后期的分组交换网 1, 35,即所谓的计算机一计算机网 络其典型代表是 ARPAnet 网。第三代基于开放的标准化 一故障,都能直接给上述应用带来灾难性的损失,其可靠性直 接关系到应用的好坏,解决好可靠性问题己成为计算机网络 正常运行的前提。 计算机网络的可靠性是指网络系统在规定条件下和设计 规定的时间范围内,保持系
10、统正常运行的能力。计算机网络 的可靠性设计准则是对设计实施过程中的工程经验进行充分 总结,使之条理化、系统化、科学化,成为计算机网络规范化设 计和建设过程所必须遵循的要求和原则。 (1) 提高计算机网络的任务可靠性通常采用余度设计和容 错技术,具体表现为网络中的各台计算机可以通过网络彼此 互为后备机,一旦某台计算机出现故障,故障机的任务便可由 其它计算机代为处理,避免了单机无后备使用情况下,某台计 算机故障导致网络系统瘫痪的现象,从而保证了计算机网络 的可靠性。 (2) 提高计算机网络可靠性要综合考量新技术的采用。既 要考虑主干网络技术的发展,采取适度超前的技术和设备,使 设计的网络能够适应现
11、在和将来的技 术发展趋势,不至于在 短时期内被淘汰,确保系统具有较长的生命周期,最大限度地 满足业务发展的需要;又要实施合理的继承性,谨慎使用新技 术,降低风险,使计算机网络的设计具备良好的兼容和扩充能 力,能够实现高可靠网络的平滑升级。 (3) 提高计算机网络的可靠性要求统筹考虑全寿命周期费 用,尽可能地降低网络系统的造价,使后期的运行、维护费用 降至最少,力求使系统达到最佳的性价比。计算机网络主要 软、硬件设备应采用广泛应用且具有良好性能价格比的产品, 充分考虑保护网络的建设投资。 (4) 提高计算机网络的可靠性,应根据现有的实际条 件,在 设计中选择质量优秀、有良好声誉的网络产品,并且所
12、用的网 络产品都应满足可靠性设计指标要求,严格遵守计算机网络 的相关规范,所有器件及子系统均需满足最新、最高的国内外 标准 17,91(例如 1995 年通过的国际标准 : ISO/IEC 11801;欧洲 标准 : EN 50173;北美标准: ANSI/EIA 568A;中国标准 : GB 50173-1993、 GB/T 50311-2000 等)。 (5) 提高计算机网络的可靠性,还需要对运行中的网络进 行定期人工 /自动的检查维护。现代计算机网络具有较大的 规模和较高的异构程度,需要尽量避免由于网络线路中断以 及设备故障等原因造成的网络系统瘫痪。但是发生故障又在 所难免,所以只有及时
13、发现计算机网络故障,具有方便的故障 恢复措施、远程监控、配置的能力,才可以保证计算机网络时 刻达到规定的可靠性指标,保证整个网络系统具有强大的功 能、优越的性能和工作任务可靠性,使计算机网络真正具有较 高的系统可靠性。 3 高可靠计算机网络的工程实例 计算机网络是单位信息系统中最基础的组成部分,是数 据和语音传递的基本通道;它关系到用户现在和将来一段时 期内,单位信息化水平和网络应用系统的成败,在设计过程中 应使整个计算机网络更可靠、更经济、性能更好。 计算机网络按照系统可划分为硬件系统和软件系统两部 分。计算机网络的硬件系统主要由主机子系统、网络备份子 系统、接口电路、通信线路等部分组成,其
14、中,主机子系统 1是 整个计算机网络的数据运算中心和数据存储中心,是整个网 络可靠性的核心。计算机网络的软件系统主要有网络管理子 系统和防火墙子系统等,其中防火墙子系统是网络系统可靠 性的主要保障 1。 3.1 计算机网络的硬件可靠性设计工程实例 中国数字地震观测网 是全国地震行业信息服务网络,是 整个数字地震观测网络和地震应急指挥的技术基础平台,该 观测网络项目涉及全国 31 个省(市)自治区,它的建设规模 是我国有史以来最大的防震减灾工程。其中,某省是中国数 图 1 某地震局 的网络拓扑结构 字地震观测网络的主要节点之一,该省地震局地震数据信息 网络平台是中国地震信息服务系统的 60 个大
15、中城市地震信 息服务系统节点之一,同时也是该省防震减灾 “ 十一五 ” 重点 建设项目,因此地震局信息中心对系统的可靠性做了突出要 求,服务器的选型需要在保证最佳性价比前提下,突出对可 靠性的要求,地震局选择了基于 AMD Opteron 处理器的曙光 服务器。 根据地震局对信息化平台的应用需求和应急规程要求, 该省地震局主机房主要包括:测震、前兆、强震动、信息的专 用服务器、数据库服务器、备份服务器、存储管理服务器、中 间件应用服务器、统一数据交换平台、公用 GIS 服务器、信息 发布、数据共享、网络管理服务器、网络防病毒服务器、邮件 应用服务器、基本网络功能服务器、 VOIP 应用管理服务
16、器。 某楼辅助机房,主要包括:应急专用服务器、基础数据服务 器,震害评估查询服务器,该地震局的计算机网络拓扑结构 如图 1 所示。 计算机网络正式运行后,各种数据不断的进出主机子系 统。主机是否可靠,是整个计算机网络能否高速高效运行的 关键,在该省地震局项目中使用曙光天阔 A620r-F服务器作为 主机主要是基于其高可靠性、高可用性和高扩展性的特性。曙 光天阔 A620r-F是一款性能卓越、稳定可靠、配置灵活的新一 代双路双核 64 位服务器,采用 2 路 AMD OpteronTM 2000 系列 处理器,利用超传输技术高速连接更多的 CPU 和芯片组资源, 具有处理速度快、可用性强等特点,
17、最重要的是它还经过了一 系列的可靠性测试 8,完全满足地震信息平台对服务器主机可 靠性的需求。 一般来说,网络中设备的可靠性较主机子系统要高的 多 1,主机子系统的可靠性基本上靠采用冗余、备份、热插拔、 容错、集 群等技术来实现。对该局数字地震观测网而言,主机 子系统的可靠性极其重要,它的故障对网络运行的影响尤为 突出,因此该省地震局主机房和辅助机房的服务器主机采取 了以下两项措施对可靠性加以保证。 (1) 双主机热冗余。在地震局的主机房采用两台 A620r-F 服务器作为工作主机,正常情况下两台工作主机均为计算机 网络提供支持,并相互监视对方的运作状况;主机房内的双主 机热冗余工作原理如图
18、2 所示。当一台主机出现异常造成不 能支持网络系统正常运作时,另一台主机就会主动接管异常 主机的工作,继续支持信息的运作,从而确保系统能够不 间断 地运行,达到增强地震局主机房服务器主机子系统可靠性的 图 2 主机房的双主机热冗余原理 目的。但正常运行主机的负载会有所增加,此时必须尽快将 异常机修复以便缩短正常机负载持续时间。当异常主机经过 维修恢复正 常以后,系统通过硬件动态监控和调度,可以将正 常主机所接管的工作切换回己被修复的异常主机 1, 7, 1112。 (2) 双主机热备份。在地震局的辅助机房,采用一台服务 器为工作主机,另一台服务器为备份主机,正常运行状态下, 工作的主机为计算机
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 提高 计算机网络 可靠性 方法 研究 张晓杰
限制150内