OLAP的三大实现技术.ppt
《OLAP的三大实现技术.ppt》由会员分享,可在线阅读,更多相关《OLAP的三大实现技术.ppt(64页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、OLAP的三大实现技术,周红庆 1100214019 计算机应用技术,目录,OLAP的实现技术 OLAP实例分析,OLAP的实现技术,关系型联机分析处理(ROLAP,Relational OLAP) 多维联机分析处理(MOLAP,Multi-Dimensional OLAP) 混合型联机分析处理(HOLAP,Hybrid OLAP),关系数据存储与多维数据存储,关系型OLAP数据存储 在关系数据库中,没有数组的概念,因此多维数据必须被映像成平面型的关系表中的行。具有代表性的是非标准化的星型模式的设计,它将基本信息存储在一个单独的事实表中,而有关维的支持信息则被存储在其他表中。 预处理的结果一般
2、被存放在大量的综合汇总表中,这些综合汇总表分别有不同的聚集及组合。他们每个都需要关键字来标识,并且通过索引来获得高效的访问。,多维数据存储与关系数据存储,多维数据库中的数据存储 多维数据库是由许多经压缩的,类似于数组的对象构成,这种对象通常带有高度压缩的索引及指针结构。每个对象由聚集成组的单元块组成,每个单元块都类似于多维数组的结构存储,并通过直接偏移计算进行存取。 由于索引只需一个较小的数来标识单元块,因此多维数据库的索引一般较小,只占数据空间的一小部分,正因为它们如此之小,以至于可以很容易地将整个索引装进内存,这将极大地提高性能。 在实际分析过程中,可能需要把任一维与其他维进行组合,因而需
3、要能够旋转数据立方体及切片的视图,即以多维方式显示数据。 在多维数据库中,并非维间的每种组合都会产生具体的值,实际上,许多组合没有具体值,是空的或者值为0。另外,许多值重复,如一年中的价格可能不变。因此多维数据库必须具有高效的稀疏数据处理能力,能略过零元、缺失和重复数据。,多维数据存储与关系数据存储,关系数据存储与多维数据存储的比较 关系数据库按表中存放的关键字记录来存放数据,数据可用通用语言SQL来访问;而多维数据存储在逻辑上按数组保存数据,它既没有通用或一致的多维模型,也没有标准的或通用的数据访问方法。 利用关系数据存储,数据仓库的尺寸可以非常大。通过使用索引和一些特殊的技术,可以增大存储
4、的尺寸,以便在多维查询时获得可接受的性能。在多维存储中,数据存储的大小通常是有限的,但数据存储可利用压缩技术,例如稀疏矩阵压缩,可以在较少空间存放更多数据。 存储在多维数据库中的信息具有更详尽的索引,可以常驻内存。且在逻辑上按数组保存数据,所以它可以在不影响索引的情况下更新数据。,关系型联机分析处理(ROLAP),ROLAP ROLAP将分析用的多维数据存储在关系数据库中,并根据应用的需要有选择的定义一批实视图作为表也存储在关系数据库中。 ROLAP主要通过一些软件工具或中间软件实现,物理层仍采用关系数据库的存储结构,因此称为虚拟OLAP(Virtual OLAP)。 尽管数据按关系型格式存储
5、,但对用户来说,数据却是按多维方式给出。为了隐藏存储格式,应创建元数据的语义层,此层将映射到关系表。为改善响应时间,还应为概括数据或聚集数据生成元数据。所有元数据存放于可被维护和管理的关系数据库中。,关系型联机分析处理(ROLAP),设计基本步骤: (1)利用星型模式、雪花模式、混合模式等技术来构造维模型。 (2)添加适当的聚集和概括数据。 (3)把大的数据库分解成可管理的部分来提高效率。 (4)添加生成的索引或位模式索引来增强功能。 (5)生成并存储元数据。元数据包括对维的定义、维到关系表格的映射、维间的层次关系、概括和聚集的定义和描述、公式和计算及其他数据等。,关系型联机分析处理(ROLA
6、P),执行查询的步骤: (1)利用数据的应用视图或维视图来构造客户工具。 (2)从客户工具查询OLAP并实时检查元数据。 (3)创建多种SELECT语句和/或相关子查询,并把它们提交给关系数据库。 (4)在数据库查询结果上完成多维功能,例如公式和计算,从字节到应用描述的转换。 (5)将结果返回给客户工具以便进一步处理和显示,或者立即进行显示。,关系型联机分析处理(ROLAP),提供给用户和管理员的主要功能有: (1)关系数据库的商业视图。 (2)维层次支持。 (3)计算、统计和财会功能,它们都可由用户扩充。 (4)细剖细节层次。 (5)选择前后端工具。 (6)数据库管理员可以增强已有的备份和恢
7、复功能,并可提供数据库的子集来进行个例分析。 (7)利用元数据导航。 (8)具有使用权限的多级安全性控制。,关系型联机分析处理(ROLAP),可能会遇到的问题: (1)此方法允许使用星型和雪花模式分解数据并进行特殊处理。这增强了功能,但代价却为关系数据库的灵活性和可扩充性带来了负面影响。这使得修改数据库会产生更多困难,而且可能需要批量修改。 (2)除非是批量装载,所用的星型模式及其变形,以及所用的聚集和概括数据都假定数据是静态的。 (3)进行行一级的计算,例如,当利润等于收入减成本时,需要置换行和列。即使采用多个SELECT语句,此种计算仍会受到限制。 (4)管理并维护元数据是一个长期的问题,
8、并且长期消耗成本。,关系型联机分析处理(ROLAP),ROLAP的实现 将数据的多维结构划分为两类表: 事实表(用来存储事实的度量值及各个维的码值) 维度表(维的描述信息,包括维的层次及成员类别等) 按照两种结构设计: 星型模型 雪花模型,关系型联机分析处理(ROLAP),财政周序号,产品代码,销售商代码,邮政编码,产品维表,时间维表,销售渠道维表,地理维表,关系型联机分析处理(ROLAP),财政周序号,产品代码,销售商代码,邮政编码,商标代码 公司代码 产品类代码 产品小类代码 产品代码,当前时间 财政周序号 财政年度序号,销售店代码 零售商代码,城市名称 国家 地区 邮政编码,商标代码 商
9、标名称,产品代码 产品名称,产品小类代码 产品小类名称,公司代码 公司名称,零售商代码 零售商名称,销售店代码 零售店名称,财政周序号 财政周名称,财政年度序号 财政年度名称,产品类代码 产品类名称,商标表,产品表,产品类表,产品小类表,公司表,产品维表,地理维表,销售渠道维表,零售商表,销售商店表,时间维表,财政年度表,财政周表,关系型联机分析处理(ROLAP),注:在ROLAP中,多维数据立方体并没有真正存在,通常需要在接受客户OLAP请求后,ROLAP服务器需要将SQL语句转化为多维存取语句,并利用连接运算拼合出多维数据立方体,因此ROLAP的响应时间较长。,关系型联机分析处理(ROLA
10、P),销售事物表,产品维表,时间维表,销售渠道维表,地理维表,JOIN,产品代码,产品维,地区维,销售商代码,财政周序号,邮政编码,时间维,通过联接提取事实,多维联机分析处理(MOLAP),MOLAP MLOAP是基于多维数据库的OLAP技术,在多维数据存储的方式,OLAP的服务设施包含OLAP服务软件和多维数据库,数据在逻辑上按数组存储,一般可选用超立方体或多立方体方式。在超立方体方式中,大于三位的对象用平面来描述,每一维都把它看成与其他维成直角。 维的属性值被映射为多维数组的下标值或下标的范围,而总结数据作为多维数组的值存储在数组的单元中。 由于MOLAP采用了新的存储结构,从物理层实现起
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- olap 实现 技术
限制150内