《spark编程基础python版期末考试题库.docx》由会员分享,可在线阅读,更多相关《spark编程基础python版期末考试题库.docx(8页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、spark编程基础python版期末考试题库一.选择判断1 .下面哪个不是RDD的特点()A.可分区B.可序列化C.可修改D.可持久化2 .关于累加器,下面哪个是错误的()A.支持加法B.支持数值类型C.可并行D.不支持自定义类型3. Scala语言中,以下说法正确的是()A.常量和变量都可以不用赋初始值B.常量需要赋初始值,变量可以不用赋初始值C.常量和变量都需要赋初始值D.常量不需要赋初始值,变量必须赋初始值4.下面对MapReduce描述错误的是()A.适合离线批处理B.具有很好的容错性和扩展性C.启动开销小、可以使用很少的磁盘到时效率提高D. Shuffle 连接 Map 和 Redu
2、ce6.下列哪一项是yarn的一级调度管理()A.计算资源管理B. Schedule的周期管理C. application内部计算模型管理D.多样化计算模型管理7. Scala里,final修饰符的描述正确的是()A.类的声明上添加final修饰符确保成员不被子类重载B.类的声明上添加final修饰符把整个类声明为final,这个类 不能被继承C.类的声明上添加final修饰符确保成员只能被子类重载一次D.以上说法都是错误的8.调用函数时指定(),参数顺序可以跟函数定义时的顺序不同A.参数名B.参数值C.默认值D.变量值9.scala中,类和它的伴生对象说法错误的是0A.类和它的伴生对象定义在
3、同一个文件中。B.类和它的伴生对象可以有不同的名称。C.类和它的伴生对象可以互相访问私有特性。D.类和它的伴生对象可以实现既有实例方法又有静态方法。10.以下()可以实现类似java中的break跳出方式A.使用一个Boolean类型的控制变量,合适的时候returnB.使用嵌套函数一从函数当中returnC.使用Breaks对象中的break方法D.使用 continueABC11. Spark可以实现哪些形式的分布式计算()A.内存式运算B.机器学习C.交互式查询D.流式计算ABCD12. Spark的算子类型()A.转换算子B.迭代算子C.动作算子D.核心算子AC13.下列哪些是spar
4、k的特点()A.运行快B.基于内存C.底层是mr运算D.速度快ABD14. spark的存储级别包含()A.MEMORY ONLYB.MEMORY ONLY SERC.MEMORYD. MEMORY_AND_DISK_SERABD15 .以下是Spark中executor的作用是()A.保存计算的RDD分区数据B.向Driver反向注册C.接受Driver端发送来的任务Task,作用在RDD上进行执行D.做资源调度任务ABC16 .关于累加器,下面哪个是正确的()A.支持加法B.支持数值类型C.可并行D.不支持自定义类型ABC17 .关于广播变量,下面哪个是正确的()A.任何函数调用B.是只读
5、的C.存储在各个节点D.存储在磁盘或HDFSABC18 . spark的特点有哪些()A.快速性B.通用性C.兼容性D.持续性ABC19 .下列选项有哪些是spark优化()A.复用同一个rddB.创建重复的rddC.尽量使用shuffle算子D.使用map-side预聚合的shuffle操作AD20 .关于累加器,下面哪个是正确的的()A.支持加法B.支持数值类型C.不可并行D.不支持自定义类型AB21 . spark的特点包括()A.快速B.通用C.可延伸D.兼容性ABD22 .容错的级别有()A.最多一次B.至少一次C. 一次仅一次D.只能一次ABC23 .关于广播变量,下面哪个是错误的
6、()A.任何函数调用B.是只读的C.存储在各个节点D.存储在磁盘或HDFSABC24 . Spark的数据本地性有哪几种()A. PROCESS_LOCAL是指读取缓存在本地节点的数据B. NODE_LOCAL是指读取本地节点硬盘数据C. ANY是指读取非本地节点数据D. B和C对ABC25 .关于master的作用,下面正确的是()A.接受driver端注册请求B.启动任务的容器ExecutorC.任务资源的调度D.监控集群ACD26 .如何解决数据倾斜()A.增大分区B.增加前缀或后缀C.减少分区D.根据需要找keyABD27 . Spark的资源分配方式包括()A.尽量集中B.尽量打散C.全部集中D.全部打散AB28 .下面哪些端口是spark自带服务的端口()A.8080B. 4040C. 8090D. 18080ABD29 .下面属于HDFS设计目标的是A.自动快速检测应对硬件错误B.流式访问数据C.移动计算比移动数据本身更划算D.简单一致性模型ABCD30.下面描述正确的是()A. HDFS将数量众多的廉价机器使得硬件错误成为常态B. HDFS支持多种软硬件平台中的可移植性C. HDFS上的一个文件大小是G或T数量级的,支持一个云中文 件数量达到千万数量级。D. HDFS上的文件可以任意修改ABC