数据挖掘试题.docx
《数据挖掘试题.docx》由会员分享,可在线阅读,更多相关《数据挖掘试题.docx(10页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、精品名师归纳总结资料word 精心总结归纳 - - - - - - - - - - - -单项题1. 某超市讨论销售纪录数据后发觉,买啤酒的人很大致率也会购买尿布,这种属于数据挖掘的哪类问题?AA. 关联规章发觉B. 聚类C.分类D. 自然语言处理3. 将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?CA. 频繁模式挖掘B.分类和猜测C. 数据预处理D.数据流挖掘4. 当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分别? BA. 分类B. 聚类C. 关联分析D.隐马尔可夫链6. 使用交互式的和可视化的技术,对数据进行探究属于数据挖掘的哪一类
2、任务?(A )A. 探干脆数据分析B.建模描述C.猜测建模D.查找模式和规章11.下面哪种不属于数据预处理的方法?DA 变量代换B 离散化C集合D估量遗漏值12. 假设 12 个销售价格记录组已经排序如下:5, 10, 11, 13, 15, 35, 50, 55, 72, 92, 204, 215使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15 在第几个箱子内?BA 第一个B其次个C 第三个D 第四个13.上题中,等宽划分时(宽度为50),15 又在哪个箱子里?AA 第一个B其次个C 第三个D 第四个16. 只有非零值才重要的二元属性被称作: C A 计数属性B 离散属性C 非对
3、称的二元属性D对称属性17. 以下哪种方法不属于特点挑选的标准方法:DA 嵌入B 过滤C包装D抽样18.下面不属于创建新属性的相关方法的是:B A 特点提取B 特点修改C 映射数据到新的空间D 特点构造22. 假设属性income 的最大最小值分别是12000 元和 98000 元。利用最大最小规范化的方法将属性的值映射到0 至 1 的范畴内。对属性income 的 73600 元将被转化为:DA 0.821B 1.224C 1.458D 0.71623.假定用于分析的数据包含属性age。数据元组中age的值如下(按递增序) :13,15,16,16, 19, 20, 20, 21, 22,
4、22,25, 25,25, 30, 33, 33, 35, 35, 36, 40, 45, 46, 52,70, 问题: 使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。其次个箱子值为: AA 18.3B 22.6C 26.8D 27.928. 数据仓库是随着时间变化的,下面的描述不正确选项CA. 数据仓库随时间的变化不断增加新的数据内容;B. 捕获到的新数据会掩盖原先的快照;C. 数据仓库随大事变化不断删去旧的数据内容;D. 数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断的进行重新综合.29. 关于基本数据的元数据是指: DA. 基本元数据与数据源,数据仓库 ,数据集
5、市和应用程序等结构相关的信息;B. 基本元数据包括与企业相关的治理方面的数据和信息;C. 基本元数据包括日志文件和简历执行处理的时序调度信息;D. 基本元数据包括关于装载和更新处理,分析处理以及治理方面的信息.可编辑资料 - - - 欢迎下载精品名师归纳总结学习资料 名师精选 - - - - - - - - - -第 1 页,共 5 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品名师归纳总结资料word 精心总结归纳 - - - - - - - - - - - -30. 下面关于数据粒度的描述不正确选项: CA. 粒度是指数据仓库小数据单元的具体程度和级别;B.
6、 数据越具体 ,粒度就越小 ,级别也就越高;C. 数据综合度越高,粒度也就越大,级别也就越高 ;D. 粒度的具体划分将直接影响数据仓库中的数据量以及查询质量.33. OLAP 技术的核心是: DA. 在线性 ;B. 对用户的快速响应;C. 互操作性 .D. 多维分析 ;34. 关于 OLAP 的特性 ,下面正确选项: D1 快速性2 可分析性3 多维性4信息性5共享性 A. 1 2 3B. 2 3 4C. 1 2 3 4D. 1 2 3 4 535. 关于 OLAP 和 OLTP 的区分描述 ,不正确选项 : CA. OLAP主要是关于如何懂得集合的大量不同的数据.它与 OTAP 应用程序不同
7、 .B. 与 OLAP 应用程序不同 ,OLTP 应用程序包含大量相对简洁的事务.C. OLAP 的特点在于事务量大,但事务内容比较简洁且重复率高.D. OLAP是以数据仓库为基础的,但其最终数据来源与OLTP 一样均来自底层的数据库系统,两者面对的用户是相同的.37. 关于 OLAP 和 OLTP 的说法 ,以下不正确选项: AA. OLAP事务量大 ,但事务内容比较简洁且重复率高.B. OLAP 的最终数据来源与OLTP 不一样 .C. OLTP 面对的是决策人员和高层治理人员.D. OLTP 以应用为核心 ,是应用驱动的.38. 设 X=1 ,2, 3 是频繁项集,就可由X 产生 C 个
8、关联规章。A 、4 B 、5 C、6 D 、740. 概念分层图是B 图。A 、无向无环B、有向无环C、有向有环D、无向有环41. 频繁项集、频繁闭项集、最大频繁项集之间的关系是:CA 、频繁项集频繁闭项集=最大频繁项集B、频繁项集= 频繁闭项集最大频繁项集C、频繁项集频繁闭项集最大频繁项集D、频繁项集= 频繁闭项集= 最大频繁项集44. 在图集合中发觉一组公共子结构,这样的任务称为 B A 、频繁子集挖掘B 、频繁子图挖掘C、频繁数据项挖掘D、频繁模式挖掘48. 以下哪些算法是分类算法,A ,DBSCANB ,C4.5C,K-Mean D,EM( B)50. 决策树中不包含一下哪种结点,A,
9、 根结点( rootnode B, 内部结点( internalnode) C,外部结点( external node) D, 叶结点( leaf node) C)53. 以下哪项关于决策树的说法是错误的CA. 冗余属性不会对决策树的精确率造成不利的影响B. 子树可能在决策树中重复多次可编辑资料 - - - 欢迎下载精品名师归纳总结学习资料 名师精选 - - - - - - - - - -第 2 页,共 5 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品名师归纳总结资料word 精心总结归纳 - - - - - - - - - - - -C. 决策树算法对于噪声
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据挖掘试题 数据 挖掘 试题
限制150内