数据集市建设_数据质量及数据管理方法.pptx
《数据集市建设_数据质量及数据管理方法.pptx》由会员分享,可在线阅读,更多相关《数据集市建设_数据质量及数据管理方法.pptx(51页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、集市建设及数据管理方法 (初稿)目录数据集市数据集市:数据仓库的子集经过ETL流程的一定粒度汇总数据面向部门级业务针对特定主题的数据集星型模式(不遵循3NF结构)缓解仓库访问瓶颈实现方式: 独立型(Ralph Kimball) 仓库是集市的联合 数据来源于业务系统 首先满足数据展示的需求 必需统一的数据仓库建设思想协调 从属型(Bill Inmon) 集市是仓库的子集 数据来源于仓库 提供更强的数据一致性和灵活性 长期规划实现目的 合并不同系统数据源 非实时更新数据的访问 信息发布面向特定用户群体 合理的查询响应时间 快速一致的视图访问 独立型 从属型实现步骤: 定义商业目标 理解数据源 确定
2、汇总粒度 定义数据模型实现原则: 统一构建 总体指导 稳定性 可适应性 可扩展性数据分层架构针对性营销数据集市基于EDW/ODS ,通过对EDW/ODS中的数据进行一定粒度的汇总,满足针对性营销IT支撑需求的数据集合 包括营销分析数据和营销事务数据 营销分析数据 数据挖掘宽表 自助取数汇总表 外部数据宽表 数据挖掘宽表 旨在为数据挖掘模型的建立和分析提供基础支撑,并为之提供有效的数据集合,提升系统效率。 包含客户属性类数据、客户拥有类数据、客户行为类数据、客户价值类数据和客户交互类数据。 自助取数汇总表 自助取数汇总表主要包含按照客户、用户等维度进行数据的初级汇总和整合,实现自助取数系统对客户
3、、产品等相关信息数据提取 外部数据宽表(外部调研数据) 在成功获取了外部数据后,可构建合适的数据集市,纳入系统的外部数据可包括:竞争对手信息、客户偏好信息、客户满意度信息等 外部数据涵盖的范围非常广泛,将所有的外部数据都加载到针对性营销的数据集市中存在较大难度。营销事务数据营销事务数据用以支撑营销活动的制定与开展套餐资料库营销资料库营销资源库 套餐资料库 套餐资料库存储已有的套餐资料,为套餐梳理和套餐方案设计环节提供数据支撑。 套餐的结构包括基本套餐和可选套餐两部分。基本套餐是套餐的主体部分,它包含了套餐的核心产品及主要优惠规则,可以独立存在;可选套餐是由客户自行选择的叠加套餐,一般不单独提供
4、,需以购买基本套餐为前提。 营销资料库 营销资料库包含了整个营销活动的策划、分析、评估环节所涉及到的除了套餐以外的内容: 市场调研所需的问卷题库 营销脚本 宣传方案 促销方案 营销活动案例 营销资源库 营销资源库包含了电信公司所拥有的渠道、销售品、外呼中心等资源的,供营销策划人员在策划时可以查询当前营销活动可以利用的营销资源;用于对营销活动所需资源的可利用性进行检查 人力资源 财务预算 广告资源 渠道资源 合作伙伴 促销品资源(包括赠送品、搭售品等) 其他支撑系统功能(如计费系统) 目录目录数据整合整合准备: 源/目标模型 数据预处理整合过程: 数据抽取 数据转换 数据加载整合规则: 数据编码
5、统一 保证数据质量 支持异常控制 流程可维护 异常处理 流程管理输出: 规则分析 包括:候选数据源确定、源与目标的映射关系、估计行数等 执行分析 包括:执行时间、执行方式、执行顺序、执行频度等 异常报告 包括:异常位置、异常原因、处理方式等 版本控制数据整合总体流程总体处理流程目录目录数据质量解决方法数据质量解决方法信息问题域信息问题域技术问题域流程问题域管理问题域数据质量管理流程 数据质量评估分析 问题解决和验证 数据质量问题分析源系统数据人员ODS系统维护人员数据质量管理人员数据质量检查人员数据质量检查问题汇总数据质量稽核分析问题问题展现ETL处理过程数据质量问题发现问题工单生成派单派单判
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 集市 建设 质量 数据管理 方法
限制150内