35套选择题目:大数据架构、高性能、数据治理题目.docx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《35套选择题目:大数据架构、高性能、数据治理题目.docx》由会员分享,可在线阅读,更多相关《35套选择题目:大数据架构、高性能、数据治理题目.docx(8页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、a. 大数据的高级处理技术(占比5%) 单选题目:1. 以下_不属于大数据的关键技术A.数据技术B.大数据安全技术和大数据质量技术C.虚拟化技术和云计算平台技术D.海量数据的存储技术答案:C2. Spark比Hadoop的MR计算高效,主要原因不包含下面_A. Spark 支持DAGB. Spark中间数据不存储磁盘,进行缓存处理。C. Spark采用MPP架构,并发处理D. 高度抽象API答案:C3. 下面对流式计算理解错误的是_A .流式计算满足高效实时的场景B.实时计算是更快的批量计算,更快的交付数据C.流式计算需要先提交流式计算作业、等待数据流触发操作D.流式计算连续计算,计算完数据丢
2、弃答案B4. Bloom Filter(BF)是一种空间效率很高的随机数据结构,下面描述错误的是_A. 它是一个判断元素是否存在集合的概率算法B. 判断如果不在集合肯定不在,如果在集合有一定的概率判错C. 它支持从集合中删除一个元素D. Hash函数的选择会影响到算法的效果答案:C多选题目5. 问:大数据引擎的性能优化手段,包含下面_A:计算引擎的任务调度时,尽量本地化计算,减少数据网络输出。B:数据以流的方式在不同stage传输,减少物化到磁盘。C:采取数据列式存储,包括轻量级压缩数据、延迟解压、向量化引擎技术。D:MPP架构采取细粒度容错,解决落后节点影响整个查询性能。答案:ABCb. 大
3、数据架构设计方法论概述(占比3%)单选题:6. 分布式系统的ID生成系统,不包含的是_A. 生成的ID必须考虑主机的差异性B. ID必须全局唯一性,不会出现重复C. ID是没有规律的,处于信息安全考虑D. 高QPS,性能强劲,低延迟交付答案A7. CAP理论理解错误的是_A. CAP的背景是同一份数据多个副本场景B. 大数据场景下对A/P要求较高,对C反而要求较低C. AP既适用于NoSQL数据库,也适用于关系型数据库D. 关系型数据库是为了保证P、A而牺牲C答案:D多选题:8. 用户行为数据处理的注意点有_A. 埋点数据一定要符合业务数据信息流才能保证数据处理的完整性和确保数据的可用性B.
4、行为数据要与其他数据源做一致性关联,确保数据的一致性和关联性C. 行为数据的元数据尽可能从源头字段化保存到数据文件中D. 埋点数据可以是可视化埋点和非可视化埋点答案:ABCDc. 大数据之常见场景下的架构设计(占比5%)单选题:9. RBAC权限模型的架构描述错误的是_A. 用于将需要做权限验证的定义为角色B. 大数据引擎Hive权限模型依赖RBACC. 角色之间可以有继承关系D. RBAC基于责任分离原则和数据抽象原则答案:B10. 大数据监控平台不包括的是_A. 服务的SLA的体系监控B. 线上功能的状态监控C. 服务调用链跟踪和问题发掘D. 提供基础的高性能RPC服务答案:D11. 高吞
5、吐架构的三要素不包含下面哪个_A. 消息中间件B. 服务高可用C. 配置管理D. 服务组件化答案:B12. 不属于服务伸缩性的架构的是_A. 服务可以通过服务器加入进来,应对不断上升的并发访问压力B. 集群服务器不能存储数据,之间是对等的架构C. 不同的产品业务之间的耦合度很小,一个产品或业务的改动不会对其他造成影响D. 上游可使用合适的负载均衡设备发现新服务或者退出的服务答案:C多选题13. 处理大数据常用的排序有:A 快速排序B 堆排序C 归并排序D 桶排序答案:ABCDd. 大数据存储及并行处理(占比2%)单选题14. 下面不属于大数据存储和计算一体数据库管理系统的是?A. ClickH
6、ouseB. PrestoDBC. HiveD. InfluxDB答案C15. NewSQL数据库的特征不包含?A. 数据自动sharding,解决扩展性问题,对用户透明B. 数据分区容灾,故障自动切换C. 分布式事务支持D. NewSQL受制于Local容量磁盘,需要考虑扩容问题答案:De. 大数据资源及安全管理(占比2%)16. Yarn是一个资源调度平台,负责为运算程序提供服务器运算资源,下面说法正确的是:A Yarn清楚用户提交程序的运行机制B Yarn的架构设计是Master和StandBy的方式C Spark、Storm等运算框架都可以整合在Yarn上面运行D Yarn与运行的应用
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 35 选择 题目 数据 架构 性能 治理
![提示](https://www.deliwenku.com/images/bang_tan.gif)
限制150内