【信息技术 】数据的分析1.0人教 中图版(2019)高中信息技术必修1.pptx
《【信息技术 】数据的分析1.0人教 中图版(2019)高中信息技术必修1.pptx》由会员分享,可在线阅读,更多相关《【信息技术 】数据的分析1.0人教 中图版(2019)高中信息技术必修1.pptx(48页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、BIG DATABIG DATA5.3 数据的分析第 五 章S H U J U D E C A I J IS H U J U D E C A I J I”授课人:XXX知识回顾新授处理数据的一般过程:数据采集数据分析数据可视化表达新授处理数据的一般过程:数据采集数据分析数据可视化表达特征探索关联分析聚类分析数据分类运用数字化工具和技术探索数据内在的结构和规律诊断过去、预测未来什么是数据分析数据分析:数据分析就是在一大批杂乱无章的数据中,运用数字化工具和技术,探索数据内在的结构和规律,构建数学模型,并进行可视化表达,通过验证将模型转化为知识,为诊断过去、预测未来发挥作用。什么是数据分析数据分析:
2、数据分析就是在一大批杂乱无章的数据中,运用数字化工具和技术,探索数据内在的结构和规律,构建数学模型,并进行可视化表达,通过验证将模型转化为知识,为诊断过去、预测未来发挥作用。运用数字化工具和技术探索数据内在的结构和规律诊断过去、预测未来ONEONE特征探索01对数据进行预处理发现和处理缺失值、异常数据特征探索数据特征探索:主要任务是对数据进行预处理,发现和处理缺失值、异常数据,绘制直方图,观察分析数据的分布特征,求最大值、最小值、极差等描述性统计量。特征探索数据特征探索:主要任务是对数据进行预处理,发现和处理缺失值、异常数据,绘制直方图,观察分析数据的分布特征,求最大值、最小值、极差等描述性统
3、计量。对数据进行预处理发现和处理缺失值、异常数据补全特征探索学号体温()00136.900200337.300447.600537.2缺失异常请观察表格,其中的数据存在哪些问题?需要做哪些处理?修正特征探索学号体温()00136.900200337.300447.600537.2缺失异常请观察表格,其中的数据存在哪些问题?需要做哪些处理?补全特征探索学号体温()00136.900200337.300447.600537.2缺失异常请观察表格,其中的数据存在哪些问题?需要做哪些处理?补全修正特征探索学号体温()00136.900200337.300400537.2请观察表格,其中的数据存在哪些问
4、题?需要做哪些处理?37.137.1取平均值特征探索散点图发现异常值观察数据的分布情况特征探索直方图观察数据的分布特征特征探索特征探索的步骤:数据清洗绘制散点图计算数据分布特征绘制直方图处理缺失值处理异常值TWOTWO关联分析02发现数据之间的关联性同时出现的规律关联分析关联分析:就是分析并发现存在于大量数据之间的关联性或相关性,从而描述一个事物中某些属性同时出现的规律和模式。关联分析关联分析:就是分析并发现存在于大量数据之间的关联性或相关性,从而描述一个事物中某些属性同时出现的规律和模式。发现数据之间的关联性事物同时出现的规律对数据进行预处理发现和处理缺失值、异常数据关联分析典型应用:购物篮
5、分析指导商品摆放01制定促销策略02寻找潜在用户03对数据进行预处理发现和处理缺失值、异常数据关联分析例:尿布与啤酒对数据进行预处理发现和处理缺失值、异常数据关联分析如何进行关联分析?序号商品1可乐,鸡蛋,火腿2可乐,尿布,啤酒3可乐,尿布,啤酒,火腿4尿布,啤酒对数据进行预处理发现和处理缺失值、异常数据关联分析步骤一:扫描数据,建立项集,统计频率次数序号商品1可乐,鸡蛋,火腿2可乐,尿布,啤酒3可乐,尿布,啤酒,火腿4尿布,啤酒C1项集出现频率次数可乐鸡蛋火腿尿布啤酒31233关联分析步骤二:计算各个集合的支持度序号商品1可乐,鸡蛋,火腿2可乐,尿布,啤酒3可乐,尿布,啤酒,火腿4尿布,啤酒
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息技术 【信息技术 】数据的分析1.0 人教 中图版2019高中信息技术必修1 信息技术 数据 分析 1.0 图版 2019 高中 必修
限制150内