OLAP的三大实现技术.pptx
《OLAP的三大实现技术.pptx》由会员分享,可在线阅读,更多相关《OLAP的三大实现技术.pptx(64页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、目录目录OLAP的实现技术OLAP实例分析第1页/共64页OLAPOLAP的实现技术的实现技术关系型联机分析处理(ROLAP,Relational OLAP)多维联机分析处理(MOLAP,Multi-Dimensional OLAP)混合型联机分析处理(HOLAP,Hybrid OLAP)第2页/共64页关系数据存储与多维数据存储关系数据存储与多维数据存储关系型OLAP数据存储 在关系数据库中,没有数组的概念,因此多维数据必须被映像成平面型的关系表中的行。具有代表性的是非标准化的星型模式的设计,它将基本信息存储在一个单独的事实表中,而有关维的支持信息则被存储在其他表中。预处理的结果一般被存放在
2、大量的综合汇总表中,这些综合汇总表分别有不同的聚集及组合。他们每个都需要关键字来标识,并且通过索引来获得高效的访问。第3页/共64页多维数据存储与关系数据存储多维数据存储与关系数据存储多维数据库中的数据存储 多维数据库是由许多经压缩的,类似于数组的对象构成,这种对象通常带有高度压缩的索引及指针结构。每个对象由聚集成组的单元块组成,每个单元块都类似于多维数组的结构存储,并通过直接偏移计算进行存取。由于索引只需一个较小的数来标识单元块,因此多维数据库的索引一般较小,只占数据空间的一小部分,正因为它们如此之小,以至于可以很容易地将整个索引装进内存,这将极大地提高性能。在实际分析过程中,可能需要把任一
3、维与其他维进行组合,因而需要能够旋转数据立方体及切片的视图,即以多维方式显示数据。在多维数据库中,并非维间的每种组合都会产生具体的值,实际上,许多组合没有具体值,是空的或者值为0。另外,许多值重复,如一年中的价格可能不变。因此多维数据库必须具有高效的稀疏数据处理能力,能略过零元、缺失和重复数据。第4页/共64页多维数据存储与关系数据存储多维数据存储与关系数据存储关系数据存储与多维数据存储的比较 关系数据库按表中存放的关键字记录来存放数据,数据可用通用语言SQL来访问;而多维数据存储在逻辑上按数组保存数据,它既没有通用或一致的多维模型,也没有标准的或通用的数据访问方法。利用关系数据存储,数据仓库
4、的尺寸可以非常大。通过使用索引和一些特殊的技术,可以增大存储的尺寸,以便在多维查询时获得可接受的性能。在多维存储中,数据存储的大小通常是有限的,但数据存储可利用压缩技术,例如稀疏矩阵压缩,可以在较少空间存放更多数据。存储在多维数据库中的信息具有更详尽的索引,可以常驻内存。且在逻辑上按数组保存数据,所以它可以在不影响索引的情况下更新数据。第5页/共64页关系型联机分析处理(关系型联机分析处理(ROLAPROLAP)ROLAP ROLAP将分析用的多维数据存储在关系数据库中,并根据应用的需要有选择的定义一批实视图作为表也存储在关系数据库中。ROLAP主要通过一些软件工具或中间软件实现,物理层仍采用
5、关系数据库的存储结构,因此称为虚拟OLAP(Virtual OLAP)。尽管数据按关系型格式存储,但对用户来说,数据却是按多维方式给出。为了隐藏存储格式,应创建元数据的语义层,此层将映射到关系表。为改善响应时间,还应为概括数据或聚集数据生成元数据。所有元数据存放于可被维护和管理的关系数据库中。DBDW基础数据元数据计算结果多维综合引擎多维视图SQL存取多维存取RDBMS服务器关系型OLAP服务器 客户第6页/共64页关系型联机分析处理(关系型联机分析处理(ROLAPROLAP)设计基本步骤:(1)利用星型模式、雪花模式、混合模式等技术来构造维模型。(2)添加适当的聚集和概括数据。(3)把大的数
6、据库分解成可管理的部分来提高效率。(4)添加生成的索引或位模式索引来增强功能。(5)生成并存储元数据。元数据包括对维的定义、维到关系表格的映射、维间的层次关系、概括和聚集的定义和描述、公式和计算及其他数据等。第7页/共64页关系型联机分析处理(关系型联机分析处理(ROLAPROLAP)执行查询的步骤:(1)利用数据的应用视图或维视图来构造客户工具。(2)从客户工具查询OLAP并实时检查元数据。(3)创建多种SELECT语句和/或相关子查询,并把它们提交给关系数据库。(4)在数据库查询结果上完成多维功能,例如公式和计算,从字节到应用描述的转换。(5)将结果返回给客户工具以便进一步处理和显示,或者
7、立即进行显示。第8页/共64页关系型联机分析处理(关系型联机分析处理(ROLAPROLAP)提供给用户和管理员的主要功能有:(1)关系数据库的商业视图。(2)维层次支持。(3)计算、统计和财会功能,它们都可由用户扩充。(4)细剖细节层次。(5)选择前后端工具。(6)数据库管理员可以增强已有的备份和恢复功能,并可提供数据库的子集来进行个例分析。(7)利用元数据导航。(8)具有使用权限的多级安全性控制。第9页/共64页关系型联机分析处理(关系型联机分析处理(ROLAPROLAP)可能会遇到的问题:(1)此方法允许使用星型和雪花模式分解数据并进行特殊处理。这增强了功能,但代价却为关系数据库的灵活性和
8、可扩充性带来了负面影响。这使得修改数据库会产生更多困难,而且可能需要批量修改。(2)除非是批量装载,所用的星型模式及其变形,以及所用的聚集和概括数据都假定数据是静态的。(3)进行行一级的计算,例如,当利润等于收入减成本时,需要置换行和列。即使采用多个SELECT语句,此种计算仍会受到限制。(4)管理并维护元数据是一个长期的问题,并且长期消耗成本。第10页/共64页关系型联机分析处理(关系型联机分析处理(ROLAPROLAP)ROLAP的实现 将数据的多维结构划分为两类表:q事实表(用来存储事实的度量值及各个维的码值)q维度表(维的描述信息,包括维的层次及成员类别等)按照两种结构设计:q星型模型
9、q雪花模型第11页/共64页关系型联机分析处理(关系型联机分析处理(ROLAPROLAP)用关系模式表达多维概念的示例图星型模式 销售事物表 产品代码邮政编码销售商代码财政周序号销售数量销售成本总销售额财政周序号产品代码销售商代码邮政编码产品维表时间维表销售渠道维表地理维表第12页/共64页关系型联机分析处理(关系型联机分析处理(ROLAPROLAP)用关系模式表达多维概念的示例图雪花模式 销售事物表 产品代码邮政编码销售商代码财政周序号销售数量销售成本总销售额财政周序号产品代码销售商代码邮政编码商标代码公司代码产品类代码产品小类代码产品代码当前时间财政周序号财政年度序号销售店代码零售商代码城
10、市名称国家地区邮政编码商标代码商标名称产品代码产品名称产品小类代码产品小类名称公司代码公司名称零售商代码零售商名称销售店代码零售店名称财政周序号财政周名称财政年度序号财政年度名称产品类代码产品类名称商标表产品表 产品类表 产品小类表公司表产品维表地理维表销售渠道维表零售商表销售商店表时间维表财政年度表财政周表第13页/共64页关系型联机分析处理(关系型联机分析处理(ROLAPROLAP)注:在ROLAP中,多维数据立方体并没有真正存在,通常需要在接受客户OLAP请求后,ROLAP服务器需要将SQL语句转化为多维存取语句,并利用连接运算拼合出多维数据立方体,因此ROLAP的响应时间较长。第14页
11、/共64页关系型联机分析处理(关系型联机分析处理(ROLAPROLAP)销售事物表产品维表时间维表销售渠道维表地理维表JOIN产品代码产品维地区维销售商代码财政周序号邮政编码时间维通过联接提取事实第15页/共64页多维联机分析处理(多维联机分析处理(MOLAPMOLAP)MOLAP MLOAP是基于多维数据库的OLAP技术,在多维数据存储的方式,OLAP的服务设施包含OLAP服务软件和多维数据库,数据在逻辑上按数组存储,一般可选用超立方体或多立方体方式。在超立方体方式中,大于三位的对象用平面来描述,每一维都把它看成与其他维成直角。维的属性值被映射为多维数组的下标值或下标的范围,而总结数据作为多
12、维数组的值存储在数组的单元中。由于MOLAP采用了新的存储结构,从物理层实现起,因此又称为物理OLAP(Physical OLAP)。第16页/共64页多维联机分析处理(多维联机分析处理(MOLAPMOLAP)基于多维数据库(MDDB)的OLAPMOLAPOLAP服务器:存储OLAP服务软件和多维数据库MDDB存储:采用“超立方体”形式MDDB存取:多维操作DBDW多维视图 基础数据 计算结果多维数据库引擎客户多维存取第17页/共64页多维联机分析处理(多维联机分析处理(MOLAPMOLAP)设计基本步骤:(1)选择功能,例如,销售收入分析和财经分析报表。(2)指明数字信息,例如存储类似销售收
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- OLAP 实现 技术
限制150内