《《大数据概论》期末试卷含答案.docx》由会员分享,可在线阅读,更多相关《《大数据概论》期末试卷含答案.docx(8页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、大数据概论期末试卷含答案1 .当前社会中,最为突出的大数据环境是I单选题*A.互联网正确答案)B.物联网C.综合国力D.自然资源.以下哪个不是大数据的特征()单选题*A.价值密度低B,数据类型繁多C.访问时间短(正确答案)D.处理速度快2 .大数据的起源是()o 单选题*A.金融B.电信C.互联网(匚确答案)D.公共管理.第三次信息化浪潮发生在哪一年前后()。单选题*A.1980B. 199537 . MongoDB数据库属于什么类型的NOSQL数据库。()|单选题| *A.图数据库B.键值数据库C.文档数据库(正确答案)D.列族数据库.如果专注于构建关系图谱,如社交网络、推荐系统等,适合采用
2、哪一类型的数 据库。()单选题*A.键值对数据库B.文档数据库C.列族数据库D.图数据库正确答案)38 .数据平滑采用的技术不包括()。单选题*A.分箱B.回归C.聚类D.数据编码F确答案). KNIME中结点的状态:结点上有三盏灯,就像红黄绿交通灯一样。当结点刚 被拖入工作区的时候,()灯亮起表示数据无法通过。单选题*A.红(正确答案)B.黄C.绿D.无法确定40 . Knime是基于Eclipse的开源数据挖掘软件,它通过工作流的方式来完成数据仓 库以及数据挖掘中数据的0操作。单选题*A.抽取转换加载(正确若未)B.转换抽取加载C.抽取加载转换D.转换加载转换. Redis数据库属于文档类
3、型的NOSQL数据库。判断题*对错(正确答案)41 . K-means是一种典型的非监督学习算法。判断题*对工确答案)错.反映数据分散性程度的最常用的一种指标是中位数。判断题*对错(正确答案)42 .颗粒度反映数据的精细化程度,越细化的数据,价值越高。判断题*对(正确答案)错.存储结构是指数据的组织形式或数据之间的联系。判断题*对错(正确答案)43 .学生关系中有学号,姓名,性别,年龄、专业等属性,其中学号是学生关系的 主码。学生选课关系中,包括学号,课程号和分数这三个属性。学号与课程号的组 合是学生选课关系的主码,学号、课程号分别都是外码。因此,这里的参照关系是 学生选课关系。判断题I*对确
4、答案)错.数据采集的过程要充分考虑其产生主体的物理性质,同时要兼顾数据应用的特 点。【判断题I*对(正确答案)错44 .大数据面对的信息价值密度都是比较高的。判断题*对错(正确答案).大数据或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软 件工具,在合理时间内管理、处理、并整理成为帮助企业经营决策更积极目的的资 讯。判断题*对:正确答案)错C. 2010(正确答案)20195 .以下说法错误的是? () |单选题I*A.大数据对传统行业有帮助B.大数据是一种思维方式C.大数据会带来机器智能D.大数据仅仅是讲数据的体量大正涨答案).下列单位不是数据单位的是()单选题*A.bitB.
5、NB(正确答案)C.GBD.TB6 .()是长期储存在计算机内、有组织的、可共享的数据集合。单选题*A.数据库系统7 .数据库(正确答案)C.数据库管理系统D.数据结构.数据库中存储的是()单选题*A.数据.数据模型C数据及数据间的联系(正解答案)D.信息8 以下哪一项属于非结构化数据。()单选题*A.企业ERP数据B.财务系统数据C.视频监控数据正就答案)D.日志数据lO.HBase是分布式列式存储系统,记录按什么集中存放。()单选题*A.列族(正确答案)B.列C.行D.不确定11.哪一种数据采集方法被看作是“软件传感器:()I单选题1*A.传感器B.系统日志正确答案)C.网络爬虫D.众包.
6、在关系数据库系统中,一个关系相当于()。|单选题*A.一张二维表正确答案)B.一条记录C一个关系数据库D.一个关系代数12 .大数据时代,数据使用的关键是单选题*A.数据收集B.数据存储C.数据分析D.数据再利用应确答案).以下哪一种数据采集方法是网站应用(如搜索引擎)主要的数据采集方式。0 单选题*A.传感器B.系统日志C.网络爬虫正就答案)D.众包.在数据集合中,每个信息不包含语义错误或相互矛盾的数据。这指的是()o 单选题*A.数据一致性(工确答案)B.数据精确性C.数据完整性D.数据时效性13 .数据清洗的方法不包括()。单选题*A.缺失值处理B.噪声数据清除C.一致性检查D.重复数据
7、记录处理正明答案)17.下列关于大数据的分析理念的说法中,错误的是()单选题*A.在数据基础上倾向于全体数据而不是抽样数据。B.在分析方法上更注重相关分析而不是因果分析。C.在分析效果上更追究效率而不是绝对精确。D.在数据规模上强调相对数据而不是绝对数据。(正说答案).以下哪一种数据采集方法是将搜集数据的任务是通过大量参与的用户来获取恰 当数据。0 单选题*A.传感器B.系统日志C.网络爬虫D.众包(F确答案)18 .与大数据密切相关的技术是()单选题*A.蓝牙B.云计算正确答案)C.博弈论D. wifi.哪一种数据变换方法可以去除数据中的噪声波动,使数据平滑。()|单选题|*A.数据标准化B
8、.数据编码C.数据归一化D.数据平滑.关系数据库的基本特征不包括哪一项。()单选题*A .数据按一定的数据模型组织、描述和存储B .可为各种用户共享、冗余度较小、易扩展C.数据独立性较高D .存储非结构化数据E确答案)20 .大数据应用需依托的新技术有()单选题*A.大规模存储与计算B.数据分析处理C.智能化D.三个选项都是小确答案).大数据时代,数据使用的关键是()。I单选题*A.数据收集B.数据存储C.数据分析D.数据再利用(工确答案)21 .从关系中选取满足条件的元组,指的是()。|单选题A.数据更新B.数据查询(正确答案)C.数据插入D.数据删除.()是一种数据库查询和程序设计语言,用
9、于查询、更新和管理关系数据库系 统。单选题*A. SQL正确答案)DDLB. DMLDCL25 . SQL的非过程化特点指的是()。单选题*A.可以独立完成数据库生命周期中的全部活动。B.使用时只需要告诉计算机“做什么”,而不需要告诉它“怎么做(正确答案)C. SQL能够独立地用于联机交互的使用方式。D .集数据定义(DDL),数据操纵(DML),数据控制CL)功能于一体。27.下列哪一项不是数据定义语句的动词()。单选题*A . CREATEB. DROPALTERC. DELETE正确答案).下列哪一项不是数据操纵语句的动词()。单选题*A. CREATE :确答案)INSERTB. UP
10、DATED. DELETE28 .事务之间是隔离的,每个事务都感觉不到系统中有其他事务在并发地执行,指 的是事务的哪一个特性0 o 单选题*A.原子性B . 一致性C .隔离性正确答案)D .持久性.事务所包含的所有操作要么全部正确地反映在数据库中,要么全部不反映,指 的是事务的哪一个特性0 o 单选题A.原子性正确答案)B . 一致性C .隔离性D .持久性29 .位于用户与操作系统之间的一层数据管理软件,指的是()|单选题I*A .数据库正确答案)B.数据库管理系统C.数据库系统D.数据库应用系统.分布式文件系统的特点()。单选题*A .易扩充B.并行高C.可靠性高D.以上都是正句3答案)
11、32 .分布式系统中,关于分片的说法,错误的是()单选题|*A .分片是水平地将一个大的数据集划分成较小的、更易于管理的数据集的过程。 这些数据集叫做碎片。B.所有碎片都是相同模式,所有碎片集合起来代表完整的数据集。C.分片对客户端来说通常是不透明的;(正确答案)D.分片允许处理负荷分布在多个节点上以实现水平可伸缩性。34 .分布式系统中,关于复制的说法,错误的是()o 单选题*A.复制在多个节点上存储数据集的多个拷贝,被叫做副本。B.数据容错可以通过数据冗余来实现,数据冗余确保单个节点失败时数据不会丢 失。C.实现复制的两种方法:主从式复制、对等式复制。D.主从式复制适合于写请求密集的负载而不是读请求密集的负载。(正确答案).在集群中一部分节点故障后,集群整体是否还能响应客户端的读写请求,指的是CAP定理中的哪一个特性()。单选题I*A.一致性(Consistency)B.可用性(Availability)(正确答案)C.分区容错性(Partition tolerance)D.以上都对36.关于NOSQL数据库的优点,说法错误的是()单选题*A.灵活的数据模型,能处理非结构化/半结构化的大数据B.很好的容灾能力,数据能够被划分和备份C.成本昂贵,大多数是开源且容易实现正确答案)D.读写性能高