《云计算与大数据技术(微课版)-模拟考试题1.docx》由会员分享,可在线阅读,更多相关《云计算与大数据技术(微课版)-模拟考试题1.docx(3页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、一、单项选择题(共10小题,每小题2分,共计20分)1 .大数据价值密度的高低与数据总量大小成反比,这是大数据的那个特点?()(A) Volume (数据量大)(B) Variety (数据类型多)(C) Velocity (流转速度快)(D) Value (价值密度低)2 .Hadoop2.x比1.x相比,有什么显著变化?()(A)增加 DataNode(B)增加 NameNode HA(C)增加 了资源管理器 YARN(D)支持 Wire-compatibility. Google GFS的Master上保存了 GFS的三种元数据,以下那种元数据不能通过日志文件 恢复()。(A)命名空间(
2、B) Chunk与文件名的映射表2 C) Chunk副本的位置信息(D)以上都不能4.关于YARN组件说法错误的是()(A) YARN 采用 master/slave 架构(B)主节点上运行主服务RcsourceManangcr(C)从节点上运行从服务NodcManagcr3 D) YARN中引入了一个逻辑概念一一槽Slot,它将各类资源抽象化5 .关于Hadoop MapReduce的执行过程,以下哪个顺序正确?()(A)输入-ReduceShuffleMap-*输出(B)输入fM叩ShuffleReduce输出(C)输入一Shuffle-M叩f Reduce输出(D)输入-Mapf Red
3、uceShuffle-输出6 .只启动HDFS,启动成功后,查看JPS,下面那个进程不在其中?()(A) HMaster (B) DataNode (C) SecondaryNameNode (D) NameNode7 .下面选项不属于Amazon提供的云计算服务的是()。(A)弹性计算云服务EC2(B)简单存储服务S3(C)简单队列服务SQS(D) Net服务8 .下列关于Hive的介绍错误的是()。(A) Hive本身不存储和处理数据,依赖HDFS存储数据,依赖MapReduce处理数据(B) Hive是构建在Hadoop之上的一个数据仓库工具(C)数据仓库Hive不需要借助于HDFS等就
4、可以完成数据的存储(D) Hive起源于Facebook内部信息处理平台9 . ZooKeeper在集群模式下运行,那么在部署ZooKeeper集群时,至少有几个节点?()(A) 4(B) 3(C) 2(D) 110 .以下不属于Gossip协议优点的是()。(A)分布式容错 (B)收敛速度快(C)去中心化(D)最终一致性二、填空题(共5小题,每空1分,共计10分)1. Amazon S3存储系统的基本结构中,涉及到的两个基本概念分别是 和。2. ZooKeeper的集群角色除Leader外还有,其被分为、。3. Hadoop集群中M叩Reduce的底层数据存储在。4. Hadoop集群中的H
5、DFS来源于Google云计算的。5. 云计算提供的三种主要服务类型分别是:、。三、判断题(共10小题,每小题1分,共计10分,正确打J,错误打X)Hadoop集群必须使用高性能服务器来搭建。()1. HDFS比较适合存储大量零碎的小文件。()HBase的一个表可以存放到多个Region服务器上。()2. 云计算是通过网络按需提供可动态伸缩的廉价计算服务。()Hive的元数据和真实数据都存储在HDFS上。()3. 云计算按照部署模式划分,可以分为公有云、私有云和混合云。()ZooKeeper中数据节点ZNode的组织方式类似于Unix的文件系统,但ZNode的读写不具 有原子性。()4. Sa
6、aS虽然能够提高部署的速度,但是其实现和升级的成本也大大增加了。()HBase使用ZooKeeper实现集群管理功能。()5. Bigtablc对存储在其中的数据不做任何解析,-律看做字符串。()四、简答题(共5小题,每题6分,共计30分)1 . YARN核心组件及其功能。2 .容灾备份定义是什么?按照容灾系统对灾难的抵抗程度怎么划分?3 .云数据中心的特征有哪些?4 .解释下面Hive语句的功能:CREATE EXTERNAL TABLE IF NOT EXISTS goods (echangeechangeSTRING,symbolSTRING,ymdSTRING,price openFLOAT,pricchighFLOAT,)PARTITIONED BY (year INT, month INT, day INT)ROW FORMAT DELIMITED FIELDS TERMINATED BY M LINES TERMINATED BY nSTORED AS TEXTFILE;.虚拟机隔离机制主要包括哪些?五、论述题(共3小题,每题10分,共计30分)L请论述手工部署全分布模式Hadoop集群的完整过程。(10分)2 .请论述云计算与大数据、物联网、人工智能、移动互联网之间的关联性。(10分).请论述Hive与关系型数据库的区别? (10分)