《《探索大数据与人工智能》习题库完整.docx》由会员分享,可在线阅读,更多相关《《探索大数据与人工智能》习题库完整.docx(11页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、探索大数据与人工智能习题库单选1、Spark Streaming是什么软件栈中的流计算?A. Spark B. Storm C. Hive D. Flume2*9中不是大批将爱从够势B的十)1S数据分飞机房命性方法出切我与标打桁耨胎c大盘相一产肌若在经发布D大数用末映可能Hi浦太3、2022年5月是哪家全球知名咨询公司在Big data: The next frontier for innovation, competition and productivity研究报告中指出,数据已经渗透到每一个行业和业务职能 之中,逐渐成为重要的生产因素的?A.比尔恩门B.麦肯锡C.扎克伯格D.乔图斯4、以
2、下哪个属于大数据在电信行业的数据商业化方面的应用?A.精准广告B.网络管理C.网络优化D.客服中心优化5、,以下哪个不属于大我据在电信行企的营而用D?A数据商业化B物麓网络C 业运国型.客户关系宫里6、2022年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立()一职,负责全面推进 数据分享平台战略,并推出大型的数据分享平台。A.首席数据官B,首席科学家C.首席执行官D.首席架构师7、下列选项中,不是kafka适合的应用场景是?A.日志采集B.消息系统C,业务系统D.流式处理8 7ST MSB班项札哪个不是HBAS鼎内滋屣?A.R 3版本C扩展 Hi9什 在么数据量一定的情况下,MapRed
3、uce是一个线性可扩展模型,请问服务器数量与处理时间 是 关京?A.数量越多处理时间越长B.数量越多处理时间越短B.数量越小处理时间越短D.没什么关系10.在Spark的软件栈中,用于机器学习的是A. Spark Streaming B. Mllib C. Gr叩hX D. SparkSQL11、Spark是在哪一年开源的?A. 1980 B. 2022 C. 1990 D. 200012、大数据的多样性使得数据被分为三种数据结构,那末以下不是三种数据结构之一的是? A结构化数据B.非结构化数据C.半结构化数据D.全结构化数据20、人工智能按照发展层级划分可以分为哪三层?A.计算智能B.感知智
4、能C.认知智能D.人工智能21、A回便雕问有监习的可以觥分为哪用类? 题B抽样问题C聚酸问题D分类逾22、Flume采用了三层架构,每一层均可以水平扩展,它们分别是?A. agent B. collector C. storage D. source23、人工智能的技术方向一共有三种,他们分别是?A.语音识别B.计算机视觉C.自然语言D.复杂编程24. Spark适用于那些场得?A 计算量大R数据量 、C端要求高D.CRM系克峥费里25、关TRDD,说岫两I姆?A. RD%能由$个分区(partition)组成B、弹 性 集中式存案C.RM 生成ch il denRi)D D一个容格的.并行做
5、敦据结构26、业务运营监控,可以基于大数据分析从下列哪三个维度为运营商监控管道和客户运营情 况?A.网络B.业务C.气候D.用户27、Yarn架构在Hadoop生态圈中有陛作用?A.资源分配B.调度C.保证协同D.计算数据28、以下数据量不能说成大;的是?A.100MB B.1000KB C100PB D.1EB29A.,厢#产力改知b 00 ;o D. ;0 、_ : 0060、一一一、。瓷:。聊;,., : , 1?- , i ,之_:?A. 0 - :B.一歧义:C.知。依赖D. -境6虬BP台含网络尸溪拓扑结;口A翻n 层斯/g 层,.雕A输A B隐 C输出 。叫6z、,:哪个;:音。
6、别畴?A. 一音听写B.-音合成C. -音转写D.一音唤醒63、Alpha Go :第一个击败、职业)髭手、_- :程序。A.国际象棋B.围棋C.,国象棋D.五子棋64、的着闭源缴+ :数一;领域。盘;断缩小,老牌灯厂商正:改变商业模;,向着什么;拢?A.闭源B.开源C.独立D.封闭65、“大数-史需要新 雌.希才立,;更-决策力、洞察发现力和流程优化:力来适应(2增长/ 5 dM财产A. ;。 B.少数C.小。D.结,化66、Spark Streaming是什么软件栈中的流计算?A. Spark B Storm . C. Hive D. Flume67心阳 利湖心鼬融愠 以帕利。用()在后端
7、给客服中心建立A亚大数脑技术B.客户画像C.客户状态D.客户心情网做 67、下列选项中正确说明价值密度低的是?A.100TB数据中有50TB有效数据B. 1TB数据中有1KB有效数据C.100PB数据中有100PB有效雌 D. 10EB数据中有10EB有效 68、学习没有标签的数据集的机器学习方法是?A.监督学习B.无监督学习C.半监督学习D.强化学习69、当前世界产生的数据总量的单位是?A. KB B. ZB C. GB D. TB70、对抗学习中两个网络互相竞争,一个负责生成样本,那末另一个负责做什么? A.判别样本B.计算样本C.统计样本D.生成样本 71、hdfs中 namenode的
8、 metadata的作用是?A,描述数搪的存储位置等属性B.存储数据C.调度数据72、rdd是由多个什么组成?a. partition b. computer c. action d. transformation73、IBM提出的大数据5V特征包括更大(Volume)、更快(Velocity)、更多(Variety)、更值钱把alue)和()一A. 量有效B.更充分C.更真实(Veracity) D.更直观 74、在Spark的软件栈中,用于流计算的是?A. Gr叩hX B. Mllib C. Spark Streaming D. SparkSQL75、以下数据量可以称为大数据的是?A. 1
9、00MB B. 100KB C. 100PB D. WOMB窄监酱郭示锲隰春窜野D.强化学习但丁77、大曲数据耒源于方方面面下头列d不可商A AP P应用B地理信息C 一块78、数据采集的基本步骤(ETL中)不包括哪项? A.抽取转换B.加载C.计算79、整个MapReduce的过程大致分为Map、Shuffle、CombineK 0?A. Red uce B. H ash C CleanD L oad ing80、人工智能通过输入的图片解析出图片的容,这种技术叫什么?A.图片识别B.语音识别C.自动驾驶D.消费金融81 -大数1f霆要处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适
10、质)、高产叫翻的信息,A.海量B.少数C.小量D.结构化82、Hadoop2系列版本中默认的HDFS的block是多大?A.32MBB.64MBC. 128MBD. 16MB83、以下哪个场景可以称为大数据场景?A.故宫游客人数B故.宫门票收入C.美团APP的定位信息D.文章容84、下列选项中,不是人工智能的算法中的学习方法的是?A.重复学习B.深度学习C.迁移学习D对.抗学习85、以下哪个不属于大数据在电信行业的数据商业化方面的应用?A.精准广告B.网络管理C.营销洞察D.大数据检测和决策86、在Spar的k软件栈中,用于图计算的是()A. Spark Streaming B.MIIibC.
11、GraphX D.SparkSQL1覆铁语言处理需要解鱼决的M点有哪些?.I语已然歧义性B.语方皆次棒性C知识fi嫩D.语境2、人工智能目前在以下哪三个领域有了长足的发展?A.健康B.教育C.探索太空D.理财3、下列选项属于人工智能的基本概念有:A.机器学习B.深度学习C. BP神经网络D.卷积神经网络4、大数据的业务应用处理需要经过哪些流程?A.数据采集B.数据清洗C.数据建模D.数据加工据清询过程中总共可数以%为三个阶段它倒是? 加工B MJtt C据/5D.数据标;加6、麦肯锡全球研究所对大数据的定义是一种规模大到在获取、存储、管理、分析方面大大 超出了传统数据库软件工具能力围的数据集合
12、,具有以下哪些特征?A.海量的数据规模B.快速的数据流转C.多样的数据类型D.价值密度低7、人工智能关键技术框架主要包括哪两层?A.基础设施B.算法C.技术D.人员8、大数据应用领域成就有哪些?A.金融B.互联网电子商务C.工业生产D.没有明显成就 9、以下哪些属于大数据在电信行业的应用?A.网络管理和优化B.数据商业化C.客户关系管理D.企业运营管理1、以下佃-珏+个属于大A数据体明匹R直斯征?.高C娄螂嫁D.姐第爨慢11、在非电信领域,大数据可被应用到的以下哪些方面? A.公共安全B.无明显应用C.智能运输D.智能建造除曾济第懿野赛D.高可靠性13、那末下列哪些技术适合流处理?A. Spa
13、rk Streaming B. Storm C. Hbase D. MapReduce14、以下哪两项是人工智能发展的标志性产品?A.深蓝B. alphago C.智能门禁D.智能手机 15 周有嵋学习的用应讨双分为糖类!Ai,问题B抽样雄心2八颗超D分演16、HDFS在哪些场景中表现很差?A.大量小文件B.随机读取C.修改文件D.存储和管理PB级别数据17、世界经济论坛以大数据的回报与风险”主题发布了全球信息技术报告第(13版), 通过该报告,各国政府逐渐认识到大数据在哪些方面有重大意义?A.推动经济发展B.改善公共服务C.增进人民福祉D.保障国家安全18、电信行业的网络管理和优化包含了两部份的优化,下列选项中不在这两项优化之的是?A.基础设施建设的优化B.网络速度的优化C,并发性的优化D.网络运营管理及优化19、通过地理位置信息可以分析出哪些信息?A.颜值B.家庭住址C.工作地址D.体重