书签分享收藏举报版权申诉 / 25

立即下载

当前位置：首页 > 技术资料 > 技术方案 > 云计算研究之数据中心.pdf

云计算研究之数据中心.pdf

上传人：索****

文档编号：76195753

上传时间：2023-03-08

格式：PDF

页数：25

大小：4.44MB

( 4.5 )

《云计算研究之数据中心.pdf》由会员分享，可在线阅读，更多相关《云计算研究之数据中心.pdf（25页珍藏版）》请在得力文库 - 分享文档赚钱的网站上搜索。

1、云计算专题研究之数据中心1.Google数据中心从整体来看，Google的云计算包括了如下的技术层次。1）网络系统：包括外部网络(Exterior Network)，这个外部网络并不是指运营商自己的骨干网，也是指在Google 云计算服务器中心以外，由Google 自己搭建的由于不同地区/国家，不同应用之间的负载平衡的数据交换网络。内部网络（Interior Network），连接各个 Google自建的数据中心之间的网络系统。2）硬件系统：从层次上来看，包括单个服务器、整合了多服务器机架和存放、连接各个服务器机架的数据中心（IDC）。3）软件系统：包括每个服务器上面的安装的单机的操作系统经过

2、修改过的Redhat Linux。Google 云计算底层软件系统（文件系统GFS、并行计算处理算法Mapreduce、并行数据库Bigtable，并行锁服务Chubby Lock，云计算消息队列GWQ）4）Google 内部使用的软件开发工具Python、Java、C+等5）Google 自己开发的应用软件Google Search、Google Email、Google Earth Google将 40 台服务器编为一个集群，而在全球范围，Google拥有 36 个数据中心。每个数据中心有150 个服务器集群。1.1 数据访问1.1.1.外部访问当一个互联网用户输入的时候，这个 URL

3、请求就会发到Google DNS 解析服务器当中去，那么Google 的DNS 服务器就会根据用户自身的IP 地址来判断，这个用户请求是来自那个国家、那个地区。根据不同用户的IP地址信息，解析到不同的Google的数据中心。进入第一道防火墙，这次防火墙主要是根据不同端口来判断应用，过滤相应的流量。如果仅仅接受浏览器应用的访问，一般只会开放 80 端口http，和443 端口https（通过 SSL 加密）。将其他的来自互联网上的非Ipv4/V6 非80/443 端口的请求都放弃，避免遭受互联网上大量的DOS 攻击。据说Google 使用了思杰科技（Citrix Systems）的Netscal

4、er 应用交换机来做web 应用的优化。NetScaler 可将Web 应用性能加速高达 5 倍。使用高级优化技术如动态缓存时，或者当网络延迟或数据包丢失增大时，性能增益会更高。这里提到的 http multiplexting 技术是可以是进行 http 的每个 session 分解开。从不同的后端服务器（缓存）来获取内容，这样可以大大提升web http 性能，同时有效降低后端 web 应用服务器的处理和联接压力。在大量的 web 应用服务器群（Web Server Farm）前，Google使用反向代理（Reverse Proxy）的技术。反向代理（Reverse Proxy）方式是指以代

5、理服务器来接受internet 上的连接请求，然后将请求转发给内部网络上的服务器，并将从服务器上得到的结果返回给internet 上请求连接的客户端，此时代理服务器对外就表现为一个服务器。Google 使用的是 Squid Cache 的软件方式来实现反向代理应用的，Squid Cache一个流行的自由软件（GNU 通用公共许可证）的代理服务器和Web 缓存服务器。Squid 有广泛的用途，从作为网页服务器的前置cache服务器缓存相关请求来提高 Web 服务器的速度。在Google web 应用服务器需要调用 Google内部存储的信息和资源的时候，再通过一个防火墙进入内部的网络，来访问其他

6、的基于自身 GFS II 系统的应用服务和数据库。1.1.2.内部访问Google 自己已经建设了跨国的光纤网络，连接跨地区、跨国家的高速光纤网络。内部网络已经都是Ipv6 的协议在运行。网络中的路由交换设备主要还是来自Juniper,Cisco,Foundry,HP这四家公司。内部网关协议（IRP）是基于 OSPF(开放式最短路径优先)进行修改的。在每个服务器机架内部连接每台服务器之间网络是100M以太网，在服务器机架之间连接的网络是1000M以太网。在每个服务器机架内，通过IP虚拟服务器（IP Virtual Server）的方式实现传输层负载 Linux内核内的平衡，这个就是所谓四层 L

7、AN 交换。IPVS 使一个服务器机架中的众多服务成为基于Linux 内核虚拟服务器。这就像在一堆服务器前安装一个负载均衡的服务器一样。当TCP/UDP 的请求过来后，使一群服务器可以使用一个单一的 IP 地址来对外提供相关的服务支撑。1.2.关键技术1.2.1Google 分布式文件系统 GFS/GFSII GFS 是Google 文件系统中最基础的模块。任何文件和数据都可以利用这种底层模块。GFS 通过基于 Linux 分布存储的方式，对于服务器来说，分成了主服务器（Master Servers）和块存储服务器（Chunk Servers），GFS 上的块存储服务器上的存储空间以 64MB

8、为单位，分成很多的存储块，由主服务器来进行存储内容的调度和分配。每一份数据都是一式三份的方式，将同样的数据分布存储在不同的服务器集群中，以保证数据的安全性和吞吐的效率提高。当需要对于文件、数据进行存储的时候，应用程序之间将需求发给主服务器，主服务器根据所管理的块存储服务器的情况，将需要存储的内容进行分配，并将可以存储的消息（使用那些块存储服务器，那些地址空间），有应用程序下面的 GFS 接口在对文件和数据直接存储到相应的块存储服务器当中。块存储服务器要定时通过心跳信号的方式告知主服务器，目前自己的状况，一旦心跳信号出了问题，主服务器会自动将有问题的块存储服务器的相关内容进行复制。以保证数据的安

9、全性。数据被存储时是经过压缩的。采用的BMDiff 和Zippy 算法。BMDiff 使用最长公共子序列进行压缩,压缩100MB/s,解压缩约 1000MB/s.类似的有 IBM Hash Suffix Array Delta Compression.Zippy 是LZW 的改进版本,压缩比不如 LZW,但是速度更快。1.2.2.Google并行计算构架 Mapreduce 有了强大的分布式文件系统，Google 遇到的问题就是怎么才能让公司所有的程序员都学会些分布式计算的程序呢？于是，那些Google 工程师们从 lisp 和其他函数式编程语言中的映射和化简操作中得到灵感，搞出了 Map/R

10、educe 这一套并行计算的框架。Map/Reduce被Google 拿来重新了 Google Search Engine 的整个索引系统。而 Doug Cutting同样用 Java 将这一套实现和 HDFS 合在一起成为Hadoop 的Core。MapReduce 是Google 提出的一个软件架构，用于大规模数据集（大于 1TB）的并行运算。概念“Map（映射）”和“Reduce（化简）”，和他们的主要思想，都是从函数式编程语言借来的，还有从矢量编程语言借来的特性。映射和化简简单说来，一个映射函数就是对一些独立元素组成的概念上的列表（例如，一个测试成绩的列表）的每一个元素进行指定的操作（

11、比如前面的例子里，有人发现所有学生的成绩都被高估了一分，他可以定义一个“减一”的映射函数，用来修正这个错误。）。事实上，每个元素都是被独立操作的，而原始列表没有被更改，因为这里创建了一个新的列表来保存新的答案。这就是说，Map 操作是可以高度并行的，这对高性能要求的应用以及并行计算领域的需求非常有用。而化简操作指的是对一个列表的元素进行适当的合并（继续看前面的例子，如果有人想知道班级的平均分该怎么做？他可以定义一个化简函数，通过让列表中的元素跟自己的相邻的元素相加的方式把列表减半，如此递归运算直到列表只剩下一个元素，然后用这个元素除以人数，就得到了平均分。）。虽然他不如映射函数那么并行，但是因

12、为化简总是有一个简单的答案，大规模的运算相对独立，所以化简函数在高度并行环境下也很有用。分布和可靠性MapReduce 通过把对数据集的大规模操作分发给网络上的每个节点实现可靠性；每个节点会周期性的把完成的工作和状态的更新报告回来。如果一个节点保持沉默超过一个预设的时间间隔，主节点（类同Google File System 中的主服务器）记录下这个节点状态为死亡，并把分配给这个节点的数据发到别的节点。每个操作使用命名文件的原子操作以确保不会发生并行线程间的冲突；当文件被改名的时候，系统可能会把他们复制到任务名以外的另一个名字上去。（避免副作用）。化简操作工作方式很类似，但是由于化简操作在并行能

13、力较差，主节点会尽量把化简操作调度在一个节点上，或者离需要操作的数据尽可能进的节点上了；这个特性可以满足 Google的需求，因为他们有足够的带宽，他们的内部网络没有那么多的机器。在Google，MapReduce 用在非常广泛的应用程序中，包括“分布grep，分布排序，web连接图反转，每台机器的词矢量，web访问日志分析，反向索引构建，文档聚类,机器学习，基于统计的机器翻译.”值得注意的是，MapReduce 实现以后，它被用来重新生成 Google的整个索引，并取代老的 ad hoc 程序去更新索引。MapReduce 会生成大量的临时文件，为了提高效率，它利用Google 文件系统来管

14、理和访问这些文件。Map reduce编程模型1.2.3.Google 分布式数据库技术 Bigtable BigTable 用来管理应用中那些结构化、半结构化的数据，BigTable 是建立在GFS，Scheduler，Lock Service 和MapReduce 之上的。上图是一个存储 Web网页的范例列表片断。行名是一个反向URL 即n.www。contents列族存放网页内容，anchor列族存放引用该网页的锚链接文本。CNN 的主页被 Sports Illustrater和MY-look的主页引用，因此该行包含了名叫“anchor:”和“anchhor:my.look.ca”的列。

15、每个锚链接只有一个版本由时间戳标识，如 t9，t8；而contents列则有三个版本，分别由时间戳t3，t5，和t6标识。每个Table 都是一个多维的稀疏图 sparse map。Table 由行和列组成，并且每个存储单元 cell 都有一个时间戳。在不同的时间对同一个存储单元cell有多份拷贝，这样就可以记录数据的变动情况。数据存储的结构是(row:string,column:string,time:int64)-string 行：表中的行键（目前任意字符串至64KB 的大小）。每一个读取或写入的数据下单行的关键是原子（不论数目不同的列被读取或行中写的），更容易为客户的原因关于系统中的行

16、为同时存在对同一行的更新。列：列项分为集合称为列的家族，它们形成了访问控制的基本单位。所有数据在一列中存储的家族通常是同一类型。当数据以这个列键值被存储之前，列的家族必须被创建。家族内的任何列键值可以使用。因为，重叠的列键值比较少，与此相反，一个表可能有无限的列数。时间戳：Bigtable的每一个细胞中可以包含多个版本同样的数据，这些版本的时间戳索引。Bigtable的时间戳 64位整数。它们可以被分配由 Bigtable的，在这种情况下，他们真正代表联聪以微秒的时间，或明确指定的客户端应用程序。应用程序需要避免冲突必须创造自己独特的时间戳。不同一个单元格的版本都存储在时间戳顺序递减，因此，最

17、近的版本可以首先阅读。1.2.4.Googl e 并行锁服务 Chubby lock 在 Google 这种的分布式系统中，需要一种分布式锁服务来保证系统的一致性。于是Google有了Chubby lock service。而同样是 Yahoo！Research 向开源贡献了Zookeeper，一个类似 Google Chubby 的项目。在Google File System(GFS)中，有很多的服务器，这些服务器需要选举其中的一台作为 master server。Value就是master server的地址，GFS 就是用 Chubby 来解决的这个问题，所有的 server 通过Chu

18、bby提供的通信协议到 Chubby server 上创建同一个文件，当然，最终只有一个 server 能够获准创建这个文件，这个server 就成为了 master，它会在这个文件中写入自己的地址，这样其它的 server 通过读取这个文件就能知道被选出的master 的地址。Chubby 首先是一个分布式的文件系统。Chubby 能够提供机制使得 client 可以在Chubby service 上创建文件和执行一些文件的基本操作。说它是分布式的文件系统，是因为一个 Chubby cell 是一个分布式的系统。但是，从更高一点的语义层面上，Chubby 是一个 lock service，一

19、个针对松耦合的分布式系统的lock service。所谓lock service，就是这个 service能够提供开发人员经常用的“锁”，“解锁”功能。通过 Chubby，一个分布式系统中的上千个client都能够对于某项资源进行“加锁”，“解锁”。Chubby 中的“锁”就是建立文件，在上例中，创建文件其实就是进行“加锁”操作，创建文件成功的那个server其实就是抢占到了“锁”。用户通过打开、关闭和读取文件，获取共享锁或者独占锁；并且通过通信机制，向用户发送更新信息。1.2.5.Google消息序列处理系统Google Workqueue GWQ（Google Workqueue）系统是负

20、责将 Mapreduce的工作任务安排各个各个计算单位的（Cell/Cluster）。仲裁（进程优先级）附表，分配资源，处理故障，报告情况，收集的结果-通常队列覆盖在 GFS 上的。消息队列处理系统可以同时管理数万服务器。通过API接口和命令行可以调动 GWQ 来进行工作。1.2.6.Googl e 分布式存储技术 Megastore Megastore是谷歌一个内部的存储系统，它的底层数据存储依赖Bigtable，也就是基于 NoSql实现的，但是和传统的 NoSql不同的是，它实现了类似 RDBMS 的数据模型(便捷性)，同时提供数据的强一致性解决方案(同一个 datacenter，基于

21、MVCC 的事务实现)，并且将数据进行细颗粒度的分区(这里的分区是指在同一个datacenter，所有 datacenter都有相同的分区数据)，然后将数据更新在机房间进行同步复制(这个保证所有 datacenter中的数据一致)。Megastore的数据复制是通过 paxos进行同步复制的，也就是如果更新一个数据，所有机房都会进行同步更新，因为使用paxos进行复制，所以不同机房针对同一条数据的更新复制到所有机房的更新顺序都是一致的，同步复制保证数据的实时可见性，采用 paxos算法则保证了所有机房更新的一致性，所以个人认为megastore的更新可能会比较慢，而所有读都是实时读(对于不同机

22、房是一致的)，因为部署有多个机房，并且数据总是最新。Scalable replication 为了达到高可用性，megastore实现了一个同步的，容错的，适合长距离连接的日志同步器为了达到高可扩展性，megastore将数据分区成一个个小的数据库，每一个数据库都有它们自己的日志，这些日志存储在NoSql中。Megastore将数据分区为一个 Entity Groups的集合，这里的 Entity Groups相当于一个按 id切分的分库，这个 Entity Groups里面有多个 Entity Group(相当于分库里面的表)，而一个 Entity Group有多个Entity(相当于表中的

23、记录)。Operation Across Entity Groups 在同一个 Entity Group中(相当于单库)的多个 Entity的更新事务采用single-phase ACID 事务，而跨 Entity Group(相当于跨库)的Entity更新事务采用two-phase ACID 事务(2段提交)，但更多使用 Megastore提供的高效异步消息实现。需要说明的一点是，这些事务都是在同一个机房的，机房之间的数据交互都是通过数据复制来实现的。1.3.数据中心灾备灾难备份与恢复有两个指标，一个是RPO(Recovery Point Objective)，一个是 RTO(Recover

24、y Time Objective)，也就是数据丢失率和恢复间隔。对传统的SAN 或异地备份，这两个指标基本取决于成本，指标越好，成本越高，Google 在这方面，使用的是同步复制技术，同步复制使RPO 接近于 0，而 RTO 接近实时，也就是说，灾难发生时，Google 所有在线应用的数据丢失基本为0，恢复间隔接近实时，使用户完全觉察不到(可是，Gmail 的几次宕机是怎么回事)。数据同步复制技术应用到所有Google 在线应用(包括 Gmail，Google Calendar，Google Docs，以及Google Sites 等)，用户需要保存的任何数据，都同步存储到Google 的两个

25、不同地理位置的数据中心，当任何一个数据中心发生故障，系统会立即切换到另一个数据中心。Google的备用数据中心并不是在灾难发生时才启用，而是一直在使用中，Google 始终在这些数据中心之间进行平衡，保证没有资源浪费。Google的数据中心之间有他们自己的高度连接网络，保证数据快速传送。2.微软数据中心微软的动态数据中心方案通过Windows Server自带的 Hyper-V技术和 System Center完美整合，提供了高可用、动态资源调配、配置管理和数据备份等功能，通过部署 Virtual Machine Manager还能对异构的虚拟化环境做统一的管理。微软的动态数据中心方案集成了H

26、yper-V，Cluster Service 以及System Center四大核心产品，能对宿主机（包括Windows Server 2008/2008 R2/2003 R2，Server Core或Hyper-V Server 2008 R2）以及不同类型的虚拟机（包括Windows 2000，Windows Server 2003/Windows XP，Windows Server 2008/Windows Vista，Windows Server 2008 R2/Windows 7，SUSE/Red Hat Linux）做统一的管理，例如配置兼容性管理、点对点服务监控、数据保护和备份等

27、，而不是仅仅对虚拟机做一些配置管理。微软动态数据中心2.1.数据访问应用程序与存储数据的工作有许多不同的方式。有时人们需要的只是简单的块，而其他情况下则要求有条理的方式来存储信息。在某些情况下，人们真正需要的是一种不同部分之间的交换数据指令。对于Azure 允许的 Windows 数据存储块，表格和队列，所有通过HTTP 进入同样的REST 方式，使用 REST API 访问Storage Service。当前模式会产生的瓶颈微软云计算 Windows Azure解决方案2.2.关键技术2.2.1.Azure Blob Storage Blob可以看做文件系统。是的，它确实和文件系统有非常多的

28、相似之处。Blob storage有两个概念：Container：可以类比成文件夹Blob：可以类比成文件和文件系统一样，用户可以针对每个container设置访问权限，可以对某个blob进行加锁(lease)从而防止 concurrency 问题，还可以使用诸如创建，删除，复制，备份，等众多功能。从存储结构上来说，我们提供了两种类型的blob：Block blob：其存储方式类似于传统的文件系统中的簇(cluster)的概念。一个blob被分成一个或多个 block进行存储。Page blob：Page blob 对随机读写进行了优化，大家可以把它类比成大型文件，例如.vhd和.mdf文件。

29、Account下可以有许多Container，Container下可以有许多 Blob，每个 Blob最大50GB，不同 Container可以位于不同的存储节点。2.2.2.Azure Table Storage 千万不要把 table storage和关系型数据库混淆起来。Windows Azure的table storage提供了一种结构化的存储方式。通俗来说，一个table可以被想象成一个 xml文件。在 xml文件中我们存放各种各样的数据，在一个table中我们也可以存放各种各样的 entity。同一个 table可以存储结构完全不同的两个entity，这和关系型数据库中需要对每张表

30、制定统一的schema是不同的。Table storage 的可变的 schema充分体现出了其灵活性。例如，你的业务需要扩展，需要往数据结构中添加新的字段，你可以在完全不修改table schema，完全不影响现有 entity的情况下，对新的 entity添加新的字段。如果你的程序可以被二次开发，第三方开发人员也完全可以在不影响你的程序所需要的entity的情况下，在同一张表中存储他们的程序所需要的，结构不同的entity。Account下可以有许多 Table，Table可以划分为无限多的 Partition，通过partition来扩展，不同 Partition可以位于不同的存储节点，

31、Table是Entity的集合，Entity是属性的集合，两个关键属性：PartitionKey提供可扩展性，RowKey 唯一标示该partition中的Entity，相同 PartitionKey的Entity存在同个存储节点，使数据操作更有效。Azure Table Storage-例子Table Partition 是拥有相同 partition 键值的所有 Entity的集合，高效地获取所有版本的 FAQ Doc 文档(单一 Partition查询)，该两个 partition 可以由不同服务器提供，实现高扩展的访问性能Windows Azure的Table 及Blob存储通过 Ac

32、count自然实现?示例2.2.3.Queue Queue提供了一种先进先出的存储方式。它通常被用于各种不同的程序间的通信。例如一个经典的应用场景：Web Role 接受用户请求，针对每个请求，在一个queue中创建一条消息(message)。Worker Role 则不断的从 queue中取出消息，并且一一处理。2.2.4.Drive 目前尚处于 beta阶段的 drive storage让开发人员能够使用标准的NTFS API 读写文件。一个 drive可以被挂接(mount)到某个特定的实例上，当作该实例对应的虚拟机的一块硬盘使用。由于drive在后台是由 page blob实现的，因此

33、你往 drive中写入的文件也会自动被写入后台的page blob。这样一来数据便得到了持久化，即使万一运行当前实例的虚拟机出了问题，你还可以在其它实例中再次挂接这块虚拟硬盘，数据并不会丢失。需要注意的是，当前一个 drive在同一时间只能被单个实例挂接。如果你需要在不同的实例中同时访问文件，还是推荐使用blob。Dive更常被用于移植现有的那些需要执行大量 I/O操作的程序。2.2.5.SQL Azure SQL Azure 是微软提供的一个云数据库系统，由微软SQL Server 2008 为主，建构在Windows Azure云操作系统之上，运行云计算(Cloud Computing)的

34、关系数据库服务(Database as a Service)，是一种云存储(Cloud Storage)的实现，提供网络型的应用程序数据存储的服务。-网络拓扑图采用DB Sharding 技术来 Partition数据，实现高度可扩展性SQL Azure 分析Sharding 模型2.2.6.虚拟化技术 Hyper-V Hyper-V 是微软最新推出的服务器虚拟化解决方案，Hyper-V和Virtual Server具有非常大的区别，前者在构架上已经完全不同于后者，可以说是微软在虚拟化技术上一个突破性的进展。我们先以 Microsoft Virtual Server 2005来了解一下微软早期

35、的虚拟化构架：Virtual Server 构架上图是微软上一代服务器虚拟化产品Virtual Server的构架，从下向上，依次为服务器硬件（x86或者x64架构）服务器操作系统（Windows Server 2003）虚拟化软件（Virtual Server）虚拟机（虚拟硬件及虚拟操作系统），虚拟的应用软件又基于虚拟操作系统上。由此可见，虚拟机到服务器硬件之间要数据要经过3层的转换，每一层的协议、通讯标准、接口等均不相同，经过3层的转换会造成性能的大量消耗，从而导致虚拟机运行速度和真实系统相差甚远。而Hyper-V 简化了虚拟机和硬件之间的层数，可以分为三部分：硬件Hyper-V虚拟机。微

36、软 Hyper-V 构架上图是微软 Hyper-V 的构架图，最下面是硬件，硬件上面就是 Hyper-V，Hyper-V是一个只有 300多K的小程序，用于连接硬件和虚拟机，Hyper-V程序非常小，代码非常少，因而减少了代码执行时发生错误的概率，并且Hyper-V中不包含任何第三方的驱动，非常的精简，所以安全性非常高。这种构架使得虚拟机和硬件之间只通过很薄的一层进行连接，不像Virtual Server那样虚拟机和硬件之间需要经过多层的转换，因而虚拟机执行效率非常高，可以更加充分的利用硬件资源，使虚拟机系统性能非常的接近真实的操作系统性能。2.3.部署通过使用 T-SQL，可以在 SQL A

37、zure 中创建或填充一个数据库。然而，大部分情况下，开发人员或数据库管理员会在本地机器上设计和填充数据库。当应用程序完成的时候，数据库再被部署到云中。为了部署一个数据库到 SQL Azure 中，你可以在 SQL Server Management Studio中使用”Generate Script Wizard”来创建 T-SQL CREATE DATABASE的脚本。你也可以运行T-SQL 脚本来创建 SQL Azure 数据库。SQL Azure 的地理位置信息是在 SQL Azure 服务器层面设置的，因此为了在一个特定的区域部署数据库，你应该在那个地理位置创建一个新的SQL Azu

38、re 服务器，连接它，然后运行数据库的脚本进行部署。3.IBM 数据中心IBM 自上世纪 60 年代开始就一直引领虚拟化领域的潮流，最近又推出了“新型企业数据中心”的设想，该设想结合了以Web 为中心的云计算模型和当前的企业数据中心的优势。新型企业数据中心将是虚拟化、高效管理的中心，它将使用以Web 为中心的云所采用的某些工具和技术，并进行一般化以便可由范围更广的客户采用，另外还进行增强以支持安全的事务性工作负载。通过高效且共享的基础架构，企业能够对新的业务需求迅速做出反应，实时解析大量信息，而且还能根据实时数据做出明智的业务决策。新型企业数据中心是一种演进的新模型，能提供有助于使IT 和业务

39、目标保持一致的高效且动态的新方法。如图所示，从高级别的架构角度来看，新企业数据中心的基础架构服务在逻辑上可分为不同的层次。首先，物理硬件层通过虚拟化以提供灵活且适应性强的平台，从而提高资源利用率。接下来通过管理层来确保数据中心内的虚拟化资源得到有效的管理，并可以快速部署和配置。从图中可以明显看出，虚拟化层和管理层是新型企业数据中心基础架构服务的关键。图 IBM 新型企业数据中心框架3.1.存储区域网 SAN 采用存储区域网，可以通过快速的、专用的光纤网络，将上百个甚至几千个存储设备连接起来，组成低成本的、易于管理的存储区域网络。存储区域网不仅可以减少数据移动对现有的网络系统的压力，从而降低存储

40、的成本，而且可以通过将存储设备的集中，方便地进行监视和调整，从而实现灵活方便的管理。SAN 系统也是云计算平台的另外一种存储体系结构选择，在IBM蓝云平台上也有一定的体现，IBM也提供 SAN 的平台能够接入到蓝云计算平台中。下图就是一个SAN 系统的结构示意图。从图中可以看到，SAN 系统是在存储端构建存储的网络，将多个存储设备构成一个存储区域网络。前端的主机可以通过网络的方式访问后端的存储设备。而且，由于提供了块设备的访问方式，与前端操作系统无关。在SAN 连接方式上，可以有多种选择。一种选择是使用光纤网络，能够操作快速的光纤磁盘，适合于对性能与可靠性要求比较高的场所。另外一种选择是使用以

41、太网，采取iSCSI 协议，能够运行在普通的局域网环境下，从而降低了成本。由于存储区域网络中的磁盘设备并没有与某一台主机绑定在一起，而是采用了非常灵活的结构，因此对于主机来说可以访问多个磁盘设备，从而能够获得性能的提升。在存储区域网络中，使用虚拟化的引擎来进行逻辑设备到物理设备的映射，管理前端主机到后端数据的读写。因此虚拟化引擎是存储区域网络中非常重要的管理模块。主服务器通过以太网连接到以太网上，每台服务器同时另外配置两块光纤通道卡，每块光纤通道卡分别连接到两台光纤交换机上。IBM的光纤交换机作为 SAN的核心部件，也采用双配置，作为高可靠的冗余配置。磁盘阵列采用双光纤通道与光纤交换机分别相连

42、。这样，任一台服务器、服务器上的通道卡、交换机出现故障，都不会影响对存储设备的访问。磁带库可以通过SAN 方式，连接到光纤交换机上，这样可以实现基于 SAN 的数据备份，从而不占用网络与数据库服务器的资源。与Google不同的是，IBM并没有基于云计算提供外部可访问的网络应用程序。这主要是由于 IBM并不是一个网络公司，而是一个 IT的服务公司。当然，IBM内部以及IBM未来为客户提供的软件服务会基于云计算的架构。3.2.数据中心灾备3.2.1.数据级灾备 PPRC IBM的PPRC（Peer to Peer Remote Copy，点对占点远程复制）复制技术是基于ESS 企业级数据存储服务器

43、，通过ESCON（Enterprise Systems Connection，企业管理系统连接，是一种光纤通道）通道建立配对的逻辑卷容灾技术。这是IBM的最高级别容灾方案，主要适用于大、中型和电信企业选用。它的网络结构（如图所示）。在图中数据中心 A和数据中心 B可以是两相隔上百公里的网络系统，既可以单独把某个数据中心的数据备份到另一个远程数据中心中，也可以实现相互远程备份。在标准的实时备份方案中，服务器主机通过 SAN 与IBM企业存储服务器 ESS 相连接，两台ESS 之间通过 ESCON 通道实现同步远程拷贝。受ESCON 传输距离的限制，当主、备机房的距离超过2公里时，需要加光纤延伸器

44、。光纤延伸器可以从多个不同的厂商购得，比如 IBM 2029 Fibre Saver、INRANGE 的9801等。在光纤延伸器的帮助下，PPRC 数据备份可达到 100公里以上。3.2.2.应用级灾备 HAGEOIBM的HAGEO（High Availability Geography）的缩写，是IBM AIX 平台最优秀的实时灾难备份软件。我们知道，前面介绍的PPRC 方案主要是通过硬件来实现的，而此处的 HAGEO 方案则主要是通过软件实现的，相对来说比较经济，但对硬件的配置也比较苛刻。这种备份方案理论上对备份中心距离没有限制，利用IP网络，不需要专用光纤；对应用程序、数据库类型和存储设

45、备类型都是透明的，即在HAGEO 下应用程序不需修改。但性能较以上介绍的PPRC 方案差些，适用于中型企业选用。HAGEO 可以为客户的数据和应用提供同步实时镜像，其中增强型同步（MWC）模式可以提供数据的原始性和一致性，同时HAGEO 也提供异步模式。HAGEO 和应用程序紧密结合，不仅仅实现数据的实时镜像，同时也可以实现应用的自动接管，大大减少了灾难发生时手工操作。HAGEO 可以做到零数据丢失，灾难恢复时间一般在半个小时左右（指应用恢复）。IBM HAGEO 容灾方案的基本设想是：生产环境是两台RS/6000服务器（如图 4所示），组成一个本地的双机热备环境。当本地的一台服务器发生故障时

46、，应用会自动切换到本地另外一台服务器上。在备份地点，由一台RS/6000服务器作为备份服务器。当生产环境中的两台服务器都不能工作时，备份地点的服务器自动启动应用，恢复正常的生产环境，（如图所示）。连接两地的网络带宽应大于2MB，以确保两地备份服务器数据同步，具体所采用的网络连接方式可以多样，如专线方式的DDN、T3、互联网宽带接入等。如果应用对 I/O的写请求很多，应提高网络带宽，以保证系统的整体性能不受影响。客户端如何访问服务器也是在做方案时需要考虑的一个重要因素。注意，HAGEO方案只能负责到（服务器）系统这一层，在灾难发生后，客户端如何访问备份中心，这一点需要在网络整体设计时加以考虑。3

47、.2.3.NAS容灾方案虽然NAS 方案大家都觉得不如 SAN，但它的廉价特性（它是采用传统的IP技术），在目前来说 SAN 还是无法比拟的，特别是对于中小型企业。针对全国性机构数据集中实时数据复制与灾害备援需求，IBM采用NAS，LTO 技术及 NSI Software Double-Take 数据同步方案，为全国性机构地市级节点以及省级中心节点提供基于NAS 存储平台的数据同步解决方案，以最经济的方式达到备援的目的，并保证系统的高可用性。该方案对于全国性机构地市级节点的数据通过现有的网络连接，占用最少的网络资源，在第一时间将数据文件以增量的方式传送至省级中心节点。同时也可实现省级中心节点向

48、地市级节点的数据发送。并且在每个地市级节点还可以实现两台NAS 存储设备之间的数据实时同步以及系统的灾难备援。并且在磁盘介质备份的基础上，可进一步实现磁盘到磁带的数据备份，以充分满足数据的安全与可用性。其中一种利用公网进行省级与市级数据中心数据通信的网络结构（如图所示）。4.Amazon 数据中心Amazon 云计算体系架构从图上 Amazon 提供的云计算服务?弹性计算云EC2?简单存储服务S3?简单数据库服务Simple DB?简单队列服务SQS?弹性 MapReduce 服务?内容推送服务CloudFront?电子商务服务DevPay?灵活支付服务FPS 几个云服务之间的关系4.1.数据

49、访问S3EC2SD BSQ SSQ S发送请求返回结果查询返回结果上传下载建立指针存储文件提取文件发送消息返回消息发送消息返回消息内容推送服务 CloudFront 服务器为中心的缺陷：?远距离访问慢?容易出故障CloudFront的流程如下图所示：4.2.关键技术4.2.1EC2弹性云计算EC2 简言之。他完全是一部具有无限采集能力的虚拟计算机，用户能够用来执行一些处理任务。然而“无限”并不不意味“无边际”;相反，他是具有上限的。亚马逊的文献阐明，你能同时租用“上百，甚至数以万计”虚拟机。亚马逊机器映像S3弹性块存储实例实例实例私

50、有 IP 地址私有 IP 地址快照防火墙Internet公有 IP地址EC2通过私钥使用 SSH方式访问存储模块4.2.1.基础存储架构 Dynamo 4.2.3.Amazon 云存储亚马逊存储相关的几个云服务，总结如下图。这里我把数据库也算在存储里面了，概念可能不完全正确。所谓的层次也并未指其间有依赖关系，而是按照其逻辑层次划分的。亚马逊云存储中 Storage 层次的概念到现实世界的已有的事物中。其AMI的概念类似于 VM，是亚马逊对外租赁的单位。因为AMI随时可能被增删，其内部存储也就权当做临时目录来使用。因此引入了EBS，类似于主机硬盘，用于存储数据库

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

20 金币

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 计算研究数据中心

得力文库 - 分享文档赚钱的网站所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

限制150内

关于本文

本文标题：云计算研究之数据中心.pdf
链接地址：https://www.deliwenku.com/p-76195753.html