联机分析处理OLAP技术不讲.ppt
《联机分析处理OLAP技术不讲.ppt》由会员分享,可在线阅读,更多相关《联机分析处理OLAP技术不讲.ppt(32页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、第13章联机分析处理(OLAP)技术 13.1 什么是什么是OLAP13.2 多维数据模型多维数据模型13.3 OLAP的实现的实现13.4 小结小结 13.1 什么是什么是OLAPOLAP(On_Line Analytical Processing)即联机分析处理,是以海量数据为基础的复杂分析技术。OLAP概念是由 于1993年提出的。OLAP软件提供的是多维分析和辅助决策功能。对于深层次的分析和发现数据中隐含的规律和知识,则需要数据挖掘(Data Mining)技术和相应的数据挖掘软件来完成。13.2 多维数据模型多维数据模型变量(变量(Measure)变量也称度量,是数据的实际意义,即描
2、述数据“是什么”。例如:数据“10000”本身并没有意义或者说意义未定,它可能是一个学校的学生人数,也可能是某产品的单价,还可能是某商品的销售量等。一般情况下,变量是一个数值的度量指标,例如:“人数”、“单价”、“销售量”等都是变量或称为度量,而“10000万元”则是变量的一个值,销售量10000万元常称为度量值。13.2.1 基本概念基本概念13.2 多维数据模型多维数据模型13.2.1 基本概念基本概念维(维(Dimension)维是人们观察数据的特定角度。例如,企业常常关心产品销售量随时间的变化情况,这时他是从时间的角度来观察产品的销售,所以时间就是一个维(时间维)。企业也时常关心自己的
3、产品在不同的地区的销售分布情况,这时他是从地区分布的角度来观察产品的销售,所以地区也是一个维(地区维)。“维”是OLAP中十分重要的概念。13.2 多维数据模型多维数据模型13.2.1 基本概念基本概念维的层次(维的层次(Hierarchy)人们观察数据的某个特定角度(即某个维)还可能存在细节程度不同的多个描述方面,我们称这多个描述方面为维的层次。例如:描述时间维时,可以从年、季、月、日等不同层次来描述,那么年、季、月、日等就是时间维的一种层次;同样,县、市、省、大区、国家等构成了地区维的一种层次。13.2 多维数据模型多维数据模型13.2.1 基本概念基本概念维成员维成员(Member)维的
4、一个取值称为该维的一个维成员,也称作维值。如果一个维的某种层次具有多个层,那么该维的维成员是不同维层的取值的组合。假设时间维的层次是年、月、日这三个层,分别在年、月、日上各取一个值组合起来,就得到了时间维的一个维成员,即“某日某月某年”。一个维成员并不一定在每个维层上都要取值,例如,“某年某月”、“某月某日”、“某年”等都是时间维的维成员。13.2 多维数据模型多维数据模型13.2.1 基本概念基本概念多维立方体多维立方体(Cube)多维数据模型的数据结构可以用这样来一个多维数组来表示:(维1,维2,,维n,度量值),例如:图13.1所示的电器商品销售数据是按时间、地区、商品,加上变量“销售额
5、”组成的一个三维数组:(地区,时间,商品,销售额)。三维数组可以用一个立方体来直观的表示。一般地多维数组用多维立方体CUBE来表示。多维立方体CUBE也称为超立方体。13.2 多维数据模型多维数据模型13.2.1 基本概念基本概念图图13.1按商品、时间和地区组织的电器商品销售数据按商品、时间和地区组织的电器商品销售数据销售额(万元)时间地区商品电视机洗衣机电冰箱北京1 2 3 413.2 多维数据模型多维数据模型13.2.1 基本概念基本概念数据单元(数据单元(Cell)多维立方体多维立方体CUBE的取值称为数据单元。当多的取值称为数据单元。当多维立方体的各个维都选中一个维成员,这些维成维立
6、方体的各个维都选中一个维成员,这些维成员的组合就唯一确定了一个变量的值。员的组合就唯一确定了一个变量的值。对于三维以上的超立方体,很难用可视化的方对于三维以上的超立方体,很难用可视化的方式直观地表示出来。为此人们用较形象的星型模式直观地表示出来。为此人们用较形象的星型模式式”(Star Schema)和和“雪片模式雪片模式”(Snow Flake Schema)来描述多维数据模型。来描述多维数据模型。13.2 多维数据模型多维数据模型13.2.1 基本概念基本概念星型模式通常由一个中心表(事实表)和一组维表组成。销售事实表销售员维顾客维时间维产品维制造商维图13.2星型模式 13.2 多维数据
7、模型多维数据模型13.2.1 基本概念基本概念星型模式的事实表与所有的维表相连,而每一个维表只与事实表相连。维表与事实表的连接是通过码来体现的,如图13.3所示。顾客代码顾客维表制造商维表销售事务表销售员维制造商代 码日期顾客代码制造商代码销售员代码产品代码销售额销售员代 码产品维表产品代码图13.3 星型模式示例13.2 多维数据模型多维数据模型13.2.1 基本概念基本概念雪片模式就是对维表按层次进一步细化后形成的。如图13.4,在“星型”维表的角上又出现了分支,这样变形的星型模式被称为“雪片模式”(Snow Flake Schema)。13.2 多维数据模型多维数据模型13.2.1 基本
8、概念基本概念销售事实表销售员维顾客维时间维产品维制造商维日月周位置顾客地区工厂类型产品类型地区销售员图13.4 雪片模式 13.2 多维数据模型多维数据模型13.2.2 多维分析的基本操作多维分析的基本操作切片(切片(Slice)在超立方体cube的某一维上选定一个维成员的操作称为切片。一次切片使原来的Cube维数减一,即结果为一个维数减一的subcube,如图13.5所示。切块(切块(Dice):):在超立方体Cube上选定两个或更多个维成员的操作称为切块。13.2 多维数据模型多维数据模型13.2.2 多维分析的基本操作多维分析的基本操作 数据切片数据切片选定时间维的维成员1997年4月
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 联机 分析 处理 OLAP 技术
限制150内