《《大数据概论》期末试卷含答案.pdf》由会员分享,可在线阅读,更多相关《《大数据概论》期末试卷含答案.pdf(12页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、大数据概论期末试卷含答案 1.当前社会中,最为突出的大数据环境是 单选题*A.互联网(正确答案)B.物联网 C.综合国力 D.自然资源 2.以下哪个不是大数据的特征()单选题*A.价值密度低 B.数据类型繁多 C.访问时间短(正确答案)D.处理速度快 3.大数据的起源是()。单选题*A.金融 B.电信 C.互联网(正确答案)D.公共管理 4.第三次信息化浪潮发生在哪一年前后()。单选题*A.1980 B.1995 C.2010(正确答案)D.2019 5.以下说法错误的是?()单选题*A.大数据对传统行业有帮助 B.大数据是一种思维方式 C.大数据会带来机器智能 D.大数据仅仅是讲数据的体量大
2、(正确答案)6.下列单位不是数据单位的是()单选题*A.bit B.NB(正确答案)C.GB D.TB 7.()是长期储存在计算机内、有组织的、可共享的数据集合。单选题*A.数据库系统 B.数据库(正确答案)C.数据库管理系统 D.数据结构 8.数据库中存储的是()单选题*A.数据 B.数据模型 C.数据及数据间的联系(正确答案)D.信息 9.以下哪一项属于非结构化数据。()单选题*A.企业 ERP 数据 B.财务系统数据 C.视频监控数据(正确答案)D.日志数据 10.HBase 是分布式列式存储系统,记录按什么集中存放。()单选题*A.列族(正确答案)B.列 C.行 D.不确定 11.哪一
3、种数据采集方法被看作是“软件传感器”。()单选题*A.传感器 B.系统日志(正确答案)C.网络爬虫 D.众包 12.在关系数据库系统中,一个关系相当于()。单选题*A.一张二维表(正确答案)B.一条记录 C.一个关系数据库 D.一个关系代数 13.大数据时代,数据使用的关键是 单选题*A.数据收集 B.数据存储 C.数据分析 D.数据再利用(正确答案)14.以下哪一种数据采集方法是网站应用(如搜索引擎)主要的数据采集方式。()单选题*A.传感器 B.系统日志 C.网络爬虫(正确答案)D.众包 15.在数据集合中,每个信息不包含语义错误或相互矛盾的数据。这指的是()。单选题*A.数据一致性(正确
4、答案)B.数据精确性 C.数据完整性 D.数据时效性 16.数据清洗的方法不包括()。单选题*A.缺失值处理 B.噪声数据清除 C.一致性检查 D.重复数据记录处理(正确答案)17.下列关于大数据的分析理念的说法中,错误的是()单选题*A.在数据基础上倾向于全体数据而不是抽样数据。B.在分析方法上更注重相关分析而不是因果分析。C.在分析效果上更追究效率而不是绝对精确。D.在数据规模上强调相对数据而不是绝对数据。(正确答案)18.以下哪一种数据采集方法是将搜集数据的任务是通过大量参与的用户来获取恰当数据。()单选题*A.传感器 B.系统日志 C.网络爬虫 D.众包(正确答案)19.与大数据密切相
5、关的技术是()单选题*A.蓝牙 B.云计算(正确答案)C.博弈论 D.wifi 20.哪一种数据变换方法可以去除数据中的噪声波动,使数据平滑。()单选题*A.数据标准化 B.数据编码 C.数据归一化 D.数据平滑(正确答案)21.关系数据库的基本特征不包括哪一项。()单选题*A数据按一定的数据模型组织、描述和存储 B可为各种用户共享、冗余度较小、易扩展 C.数据独立性较高 D存储非结构化数据(正确答案)22.大数据应用需依托的新技术有()单选题*A.大规模存储与计算 B.数据分析处理 C.智能化 D.三个选项都是(正确答案)23.大数据时代,数据使用的关键是()。单选题*A.数据收集 B.数据
6、存储 C.数据分析 D.数据再利用(正确答案)24.从关系中选取满足条件的元组,指的是()。单选题*A.数据更新 B.数据查询(正确答案)C.数据插入 D.数据删除 25.()是一种数据库查询和程序设计语言,用于查询、更新和管理关系数据库系统。单选题*A.SQL(正确答案)B.DDL C.DML D.DCL 26.SQL的非过程化特点指的是()。单选题*A可以独立完成数据库生命周期中的全部活动。B.使用时只需要告诉计算机“做什么”,而不需要告诉它“怎么做”。(正确答案)C.SQL能够独立地用于联机交互的使用方式。D集数据定义(DDL),数据操纵(DML),数据控制(DCL)功能于一体。27.下
7、列哪一项不是数据定义语句的动词()。单选题*ACREATE B.DROP C.ALTER D.DELETE(正确答案)28.下列哪一项不是数据操纵语句的动词()。单选题*A.CREATE(正确答案)B.INSERT C.UPDATE D.DELETE 29.事务之间是隔离的,每个事务都感觉不到系统中有其他事务在并发地执行,指的是事务的哪一个特性()。单选题*A.原子性 B一致性 C隔离性(正确答案)D持久性 30.事务所包含的所有操作要么全部正确地反映在数据库中,要么全部不反映,指的是事务的哪一个特性()。单选题*A.原子性(正确答案)B一致性 C隔离性 D持久性 31.位于用户与操作系统之间
8、的一层数据管理软件,指的是()单选题*A数据库(正确答案)B数据库管理系统 C.数据库系统 D.数据库应用系统 32.分布式文件系统的特点()。单选题*A易扩充 B.并行高 C.可靠性高 D.以上都是(正确答案)33.分布式系统中,关于分片的说法,错误的是()单选题*A分片是水平地将一个大的数据集划分成较小的、更易于管理的数据集 的过程。这些数据集叫做碎片。B.所有碎片都是相同模式,所有碎片集合起来代表完整的数据集。C.分片对客户端来说通常是不透明的;(正确答案)D.分片允许处理负荷分布在多个节点上以 实现水平可伸缩性。34.分布式系统中,关于复制的说法,错误的是()。单选题*A.复制在多个节
9、点上存储数据集的多个拷贝,被叫做副本。B.数据容错可以通过数据冗余来实现,数据冗余确保单个节点失败时数据不会丢失。C.实现复制的两种方法:主从式复制、对等式复制。D主从式复制适合于写请求密集的负载而不是读请求密集的负载。(正确答案)35.在集群中一部分节点故障后,集群整体是否还能响应客户端的读写请求,指的是 CAP 定理中的哪一个特性()。单选题*A.一致性(Consistency)B.可用性(Availability)(正确答案)C.分区容错性(Partition tolerance)D.以上都对 36.关于 NOSQL数据库的优点,说法错误的是()单选题*A.灵活的数据模型,能处理非结构化
10、/半结构化的大数据 B.很好的容灾能力,数据能够被划分和备份 C.成本昂贵,大多数是开源且容易实现(正确答案)D.读写性能高 37.MongoDB数据库属于什么类型的 NOSQL数据库。()单选题*A.图数据库 B.键值数据库 C.文档数据库(正确答案)D.列族数据库 38.如果专注于构建关系图谱,如社交网络、推荐系统等,适合采用哪一类型的数据库。()单选题*A.键值对数据库 B.文档数据库 C.列族数据库 D.图数据库(正确答案)39.数据平滑采用的技术不包括()。单选题*A.分箱 B.回归 C.聚类 D.数据编码(正确答案)40.KNIME 中结点的状态:结点上有三盏灯,就像红黄绿交通灯一
11、样。当结点刚被拖入工作区的时候,()灯亮起表示数据无法通过。单选题*A.红(正确答案)B.黄 C.绿 D.无法确定 41.Knime是基于 Eclipse的开源数据挖掘软件,它通过工作流的方式来完成数据仓库以及数据挖掘中数据的()操作。单选题*A.抽取 转换 加载(正确答案)B.转换 抽取 加载 C.抽取 加载 转换 D.转换 加载 转换 42.Redis 数据库属于文档类型的 NOSQL数据库。判断题*对 错(正确答案)43.K-means 是一种典型的非监督学习算法。判断题*对(正确答案)错 44.反映数据分散性程度的最常用的一种指标是中位数。判断题*对 错(正确答案)45.颗粒度反映数据
12、的精细化程度,越细化的数据,价值越高。判断题*对(正确答案)错 46.存储结构是指数据的组织形式或数据之间的联系。判断题*对 错(正确答案)47.学生关系中有学号,姓名,性别,年龄、专业等属性,其中学号是学生关系的主码。学生选课关系中,包括学号,课程号和分数这三个属性。学号与课程号的组合是学生选课关系的主码,学号、课程号分别都是外码。因此,这里的参照关系是学生选课关系。判断题*对(正确答案)错 48.数据采集的过程要充分考虑其产生主体的物理性质,同时要兼顾数据应用的特点。判断题*对(正确答案)错 49.大数据面对的信息价值密度都是比较高的。判断题*对 错(正确答案)50.大数据或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。判断题*对(正确答案)错