国家开放大学《大数据技术》形考任务1-4参考答案.docx
《国家开放大学《大数据技术》形考任务1-4参考答案.docx》由会员分享,可在线阅读,更多相关《国家开放大学《大数据技术》形考任务1-4参考答案.docx(17页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、国家开放大学大数据技术形考任务1-4参考答案形考任务1一、单选题1、第一次信息化浪潮主要解决什么问题?A.信息传输B.信息处理C.信息爆炸D.信息转换2、下面哪个选项属于大数据技术的“数据存储和管理”技术层面的功能?A.利用分布式文件系统、数据仓库、关系数据库等实现对结构化、半结构化和非结构化海量数据的存储和管理B.利用分布式并行编程模型和计算框架,结合机器学习和数据挖掘算法,实现对海量数据的处理和分析C.构建隐私数据保护体系和数据安全体系,有效保护个人隐私和数据安全D.把实时采集的数据作为流计算系统的输入,进行实时处理分析3、在大数据的计算模式中,流计算解决的是什么问题?A.针对大规模数据的
2、批量处理B.针对大规模图结构数据的处理C.大规模数据的存储管理和查询分析D.针对流数据的实时计算4、下列哪个不属于HADoop的特性?A.成本高B.高可靠性C.高容错性D.运行在Linux平台上5、HADoop框架中最核心的设计是什么?A.为海量数据提供存储的HDFS和对数据进行计算的MApReDuCeB.提供整个HDFS文件系统的NAmeSpACe命名空间管理、块管理等所有服务C.HADoop不仅可以运行在企业内部的集群中,也可以运行在云计算环境中D.HADoop被视为事实上的大数据处理标准6、在一个基本的HADoop集群中,DAtANoDe主要负责什么?A.负责执行由JoBTrACker指
3、派的任务B.协调数据计算任务C.负责协调集群中的数据存储D.存储被拆分的数据块7、分布式文件系统指的是什么?A.把文件分布存储到多个计算机节点上,成千上万的计算机节点构成计算机集群B.用于在HADoop与传统数据库之间进行数据传递C.一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统D.一种高吞吐量的分布式发布订阅消息系统,可以处理消费者规模的网站中的所有动作流数据8、下面哪一项不属于计算机集群中的节点?A.主节点MAsterNoDeB.源节点SourCeNoDeC.名称结点NAmeNoDeD.从节点SlAveNoDe9、在HDFS中,默认一个块多大?A.64MBB.32KBC.1
4、28KBD.16KB10、下列哪一项不属于HDFS采用抽象的块概念带来的好处?A.简化系统设计B.支持大规模文件存储C.强大的跨平台兼容性D.适合数据备份二、多选题1、第三次信息化浪潮的标志是哪些技术的兴起?A.个人计算机B.物联网C.云计算D.大数据2、信息科技为大数据时代提供哪些技术支撑?A.存储设备容量不断增加B.网络带宽不断增加C.CPU处理能力大幅提升D.数据量不断增大3、大数据具有哪些特点?A.数据的“大量化”B.数据的“快速化”C.数据的“多样化”D.数据的“价值密度比较低”4、HADoop的特性包括哪些?A.高可扩展性B.支持多种编程语言C.成本低D.运行在Linux平台上5、
5、下面哪个是HADoop2.0的组件?A.ResourCeMAnAgerB.JoBTrACkerC.TAskTrACkerD.NoDeMAnAger6、一个基本的HADoop集群中的节点主要包括什么?A.DAtANoDe:存储被拆分的数据块B.JoBTrACker:协调数据计算任务C.TAskTrACker:负责执行由JoBTrACker指派的任务D.SeConDAryNAmeNoDe:帮助NAmeNoDe收集文件系统运行的状态信息7、HDFS要实现以下哪几个目标?A.兼容廉价的硬件设备B.流数据读写C.大数据集D.复杂的文件模型8、HDFS特殊的设计,在实现优良特性的同时,也使得自身具有一些应
6、用局限性,主要包括以下哪几个方面?A.较差的跨平台兼容性B.无法高效存储大量小文件C.不支持多用户写入及任意修改文件D.不适合低延迟数据访问9、HDFS采用抽象的块概念可以带来以下哪几个明显的好处?A.支持大规模文件存储B.支持小规模文件存储C.适合数据备份D.简化系统设计10、在HDFS中,名称节点(NAmeNoDe)主要保存了哪些核心的数据结构?A.FsImAgeB.DN8C.BloCkD.EDitLog形考任务2一、单选题1、下列关于BigTABle的描述,哪个是错误的?A.爬虫持续不断地抓取新页面,这些页面每隔一段时间地存储到BigTABle里B.BigTABle是一个分布式存储系统C
7、.BigTABle起初用于解决典型的互联网搜索问题D.网络搜索应用查询建立好的索引,从BigTABle得到网页2、下列选项中,关于HB.A.se和BigTABle的底层技术对应关系,哪个是错误的?A.GFS与HDFS相对应B.GFS与Zookeeper相对应C.MApReDuCe与HADoopMApReDuCe相对应D.ChuBBy与Zookeeper相对应3、在HBAse中,关于数据操作的描述,下列哪一项是错误的?A.HBAse采用了更加简单的数据模型,它把数据存储为未经解释的字符串B.HBAse操作不存在复杂的表与表之间的关系C.HBAse不支持修改操作D.HBAse在设计上就避免了复杂的
8、表和表之间的关系4、下列哪个不属于NoSQL数据库的特点?A.灵活的可扩展性B.灵活的数据模型C.与云计算紧密融合D.数据存储规模有限5、下面关于NoSQL和关系数据库的简单比较,哪个是错误的?A.RDBMS有关系代数理论作为基础,NoSQL没有统一的理论基础B.NoSQL很难实现横向扩展,RDBMS可以很容易通过添加更多设备来支持更大规模的数据C.RDBMS需要定义数据库模式,严格遵守数据定义,NoSQL一般不存在数据库模式,可以自由灵活定义并存储各种不同类型的数据D.RDBMS借助于索引机制可以实现快速查询,很多NoSQL数据库没有面向复杂查询的索引6、下列哪一项不属于NoSQL的四大类型
9、?A.文档数据库B.图数据库C.列族数据库D.时间戳数据库7、下列哪个不属于云计算的优势?A.按需服务B.随时服务C.通用性D.价格不菲8、下列关于云数据库的描述,哪个是错误的?A.云数据库是部署和虚拟化在云计算环境中的数据库B.云数据库是在云计算的大背景下发展起来的一种新兴的共享基础架构的方法C.云数据库价格不菲,维护费用极其昂贵D.云数据库具有高可扩展性、高可用性、采用多租形式和支持资源有效分发等特点9、下列哪一个不属于云数据库产品?A.本地安装MySQLB.阿里云RDSC.OrACleClouDD.百度云数据库10、UMP系统是构建在一个大的集群之上的,下列哪一项不属于系统向用户提供的功
10、能?A.读写分离B.分库分表C.数据安全D.资源合并二、多选题1、关系数据库已经流行很多年,并且HADoop已经有了HDFS和MApReDuCe,为什么需要HBAse?A.HADoop可以很好地解决大规模数据的离线批量处理问题,但是,受限于HADoopMApReDuCe编程框架的高延迟数据处理机制,使得HADoop无法满足大规模数据实时处理应用的需求上B.HDFS面向批量访问模式,不是随机访问模式C.传统的通用关系型数据库无法应对在数据规模剧增时导致的系统扩展性和性能问题D.传统关系数据库在数据结构变化时一般需要停机维护;空列浪费存储空间2、HBAse与传统的关系数据库的区别主要体现在以下哪几
11、个方面?A.数据类型B.数据操作C.存储模式D.数据维护3、HBAse访问接口类型包括哪些?A.NAtiveJAvAAPIB.HBAseShellC.ThriftGAtewAyD.RESTGAtewAy4、关系数据库已经无法满足WeB2.0的需求,主要表现在以下几个方面?A.无法满足海量数据的管理需求B.无法满足数据高并发的需求C.无法满足高可扩展性和高可用性的需求D.使用难度高5、下列关于MySQL集群的描述,哪些是正确的?A.复杂性:部署、管理、配置很复杂B.数据库复制:MySQL主备之间一般采用复制方式,很多时候是异步复制C.扩容问题:如果系统压力过大需要增加新的机器,这个过程涉及数据重
12、新划分D.动态数据迁移问题:如果某个数据库组压力过大,需要将其中部分数据迁移出去6、关系数据库引以为傲的两个关键特性完善的事务机制和高效的查询机制,到了WeB2.0时代却成了鸡肋,主要表现在以下哪几个方面?A.WeB2.0网站系统通常不要求严格的数据库事务B.WeB2.0网站系统基本上不用关系数据库来存储数据C.WeB2.0并不要求严格的读写实时性D.WeB2.0通常不包含大量复杂的SQL查询7、云数据库具有以下哪些特性?A.动态可扩展B.高可用性C.免维护D.安全8、下列关于云数据库的描述,哪些是正确的?A.AmAzon是云数据库市场的先行者B.GoogleClouDSQL是谷歌公司推出的基
13、于MySQL的云数据库C.从数据模型的角度来说,云数据库并非一种全新的数据库技术D.云数据库并没有专属于自己的数据模型9、UMP系统架构设计遵循了以下哪些原则?A.保持单一的系统对外入口,并且为系统内部维护单一的资源池B.消除单点故障,保证服务的高可用性C.保证系统具有良好的可伸缩,能够动态地增加、删减计算与存储节点D.保证分配给用户的资源也是弹性可伸缩的10、UMP系统架构依赖的哪些开源组件?A.MnesiAB.LVSC.RABBitMQD.ZooKeeper形考任务3一、单选题1、下列传统并行计算框架,说法错误的是哪一项?A.刀片服务器、高速网、SAN,价格贵,扩展性差上B.共享式(共享内
14、存/共享存储),容错性好C.编程难度高D.实时、细粒度计算、计算密集型2、下列关于MApReDuCe模型的描述,错误的是哪一项?A.MApReDuCe采用“分而治之”策略B.MApReDuCe设计的一个理念就是“计算向数据靠拢”C.MApReDuCe框架采用了MA.ster/SlAve架构D.MApReDuCe应用程序只能用JAvA来写3、HADoop1.0的核心组件仅指MApReDuCe和HDFS,不包括HADoop生态系统内的Pig、Hive、HBAZe等其他组件,下列哪项是它的不足?A.抽象层次高B.表达能力有限,抽象层次低,需人工编码C.价格昂贵D.可维护性低4、下面哪个选项不属于HA
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大数据技术 国家 开放 大学 数据 技术 任务 参考答案
限制150内