《探索大数据和人工智能(DOC30)45232.doc》由会员分享,可在线阅读,更多相关《探索大数据和人工智能(DOC30)45232.doc(39页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、Evaluation Warning: The document was created with Spire.Doc for .NET.探索大数据和人工智能1、2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立()一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平台。 A首席数据官B.首席科学家家C.首席执行官官D.首席架构师师2、整个 MaapReduuce的过程大致致分为Map、 Shufffle、 Combbine、()?A. ReduuceB.HashC. CleaanD. Loadding3、在Spakk的软件栈中,用于交互式式查询的是A. SparrkSQL
2、B.MllibbC.GraphhXD. Sparrk Strreaminng4、在数据量一一定的情况下下, MappReducce是一个线性性可扩展模型型,请问服务器器数量与处( )理时间间是什么关系系?A数量越多处理理时间越长B.数量越多处处理时间越短短C.数量越小处处理时间越短短D.没什么关系系5、下列选项中中,不是 kafkka适合的应用用场景是?A.日志收集B.消息系统C.业务系统D.流式处理6、大数据的多多样性使得数数据被分为三三种数据结构构,那么以下不不是三种数据据结构之一的的是A.结构化数据据B.非结构化数数据C.半结构化数数据D.全结构化数数据7、下列选项中中,不是人工智智能的
3、算法中中的学习方法法的是? A.重复学习B.深度学习C.迁移学习D.对抗学习8、自然语言处处理难点目前前有四大类,下列选项中中不是其中之之一的是 A.机器性能B.语言歧义性性C.知识依赖D.语境9、传統的机器器学习方法包包括监督学习习、无监督学学习和半监督督学习,其中监督学学习是学习给给定标签的数数据集。请问问标签为离散散的类型,称为分类,标签为连续续的类型,称为什么? A.给定标签B.离散C.分类D.回归10、中国移动动自主研发、发发布的首个人人工智能平台台叫做() A.九天B. OneNNETC.移娃D.大云11、HDFSS中 Nameenodeff的 Metaadata的作用是?A.描述
4、数据的的存储位置等等属性B.存储数据C.调度数据D.12、电信行业业的客户关系系管理中,客服中心优优化可以实现现严重问题及及时预警,请问是用的的什么技术实实现的? A大数据技术B.互联网技术术C.游戏技术D.影像技术13、随着闭源源软件在数据据分析领域的的地盘不断缩缩小,老牌IT厂商正在改改变商业模式式,向着什么靠靠拢? A.闭源B.开源C.独立D.封闭14、以下不是是非结构化数数据的项是? A.图片B.音频C.数据库二维维表数据D.视频15、以下数据据单位换算错错误的是? A.1KB=11024BB. 1GB=1024MMBC.1TB=11000GBBD. 1MB=1024KKB16、下列选
5、项项中,不是Flume的特点的是?A.可靠性B.集中式架构构C.可扩展性D.可管理性17、BP神经经网络模型拓拓扑结构不包包括 A.输入层B.隐层C.翰出层D.显层18、以下哪个个不是语音识识别的范畴? A.语音听写B.语音台成C.语音转写D.语音唤醒19、以下哪个个场景可以称称为大数据场场景? A.故宫游客人人B.故宫门票收收入C.美团APPP的定位信息息D.文章内容20、20111年5月是哪家全全球知名咨询询公司在 Big data: The next fronttier ffor innnovattion, compeetitioon andd prodductivvity研究报告告中指
6、出,数据已经渗渗透到每一个个行业和业务务职能之中,逐渐成为重重要的生产因因素的? A.比尔恩门B.麦肯锡C.扎克伯格D.乔图斯21、下列选项项中,哪项是分布布式文件存储储系统?A.HDFSB. FlummeC. KafkkaD. Zookkeeperr22、下列选项项中,正确描述Flume对数据源的的支持的是A.只能使用HHDFS数据源B.可以配置数数据源C.不能使用文文件系统D.不能使用目目录方式23、机器学习习研究如何通通过计算的手手段,利用经验来来改善系统自自身的性能,请问机器学学习利用数据据训练出什么么? A.模型B.表结构C.结果D.报表24、下列选项项中,不是人工智智能的算法中中的
7、学习方法法的是 A.重复学习B.深度学习C.迁移学习D.对抗学习25、语音识别别产品体系有有四部分,下列哪项不不是体系之一一? A.语音合成B.语音播放C.语音识别D.语义理解26、今年,大大数据分析将将出现革命性性的新方法,从前的很多多算法和基础础理论可能会会产生理论級級别的突破。而而哪项技术将将继续成为大大数据智能分分析的核心技技术 A机器学习B.智能物流C.脑科学D.智能终端27、以下哪个个不属于大数数据在电信行行业的数据商商业化方面的的应用 A.精准广告B.网络管理C.营销洞察D.大数据检测测和决策28、RDD是是由多个什么么组成?A.partiitionB. compputerC.
8、ActiionD. Trannsformmationn29、下列选项项中,不是大大数据的一部部分的是? A.海量计算B.大量数据管管理C.数据分析D.单机计算30、属于“人人造智能”,具有意识,达到或超越越人类智慧水水平的人工看看能称为() A.高人工智能能B.低人工智能能C.强人工智能能D.弱人工智能能31、 mappreducce计算模型适适用于哪种任任务?A.多线程处理理B.有关联的行行处理C.批处理D.实时数据变变化处理32、当前世界界产生的数据据总量的单位位是? A.KBB. ZBC.GBD.TB33、IBM提提出的大数据据5V特征包括更更大( Vollume)、更快( Velloc
9、ityy)、更多Varieety)、更值钱(Value)和() A.更有效B.更充分C.更真实( Veraccity)D.更直观34、 Spaark.是基于什么么的迭代计算算框架?它适用于需需要多次操作作特定数据集集的应用场合合。需要反复复操作的次数数越多,所需读取的的数据量越大大,受益越大,数据量小但但是计算密集集度较大的场场合,受益就相对对较小A.内存B.硬盘C.磁带D.显卡35、下列选项项中,不是 kafkka适合的应用用场景是?A.日志收集B.消息系统C.业务系統D.流式处理36、数据采集集的基本步骤骤(ETL)中不包括哪哪项?A.抽取转换B.加载C.计算D.37、以下哪种种学习方法不
10、不属于人工智智能算法? A.迁移学习B.对抗学习C.强化学习D.自由学习38、语音识别别常用的应用用有四个,下列不是常常用应用的是是? A聊天B.拨号C.导航D.设备控制39、下列选项项中,哪项是由谷谷歌开发的人人工能箅法框框架? A. KafkkaB. TenssorfloowC. CafffeD. Torcch40、“大数据据”是需要新处处理模式才能能具有更强的的决策力、洞洞察发现力和和流程优化能能力来适应()、高増长率率和多样化的的信息资产。A.海量B.少数C.小量D.结构化41、MPP是是指A.大规模并行行处理系统B.受限的分布布式计算模型型C.集群计算资资源管理框架架D.分布式计算算
11、编程框架42、 Haddoop是()年诞生的?A.1985-1985B.1995-1996C.2005-2006D.2015-201643、在 Sppark的软件栈中,用于流计算算的是?A. GrapphXB. MlliibC. Sparrk StrreaminngD. SparrkSQL44、以下数据据量可以称为为大数据的是是A. 100MMBB.100KBBC. 100PPBD.100MBB45、人工智能能通过输入的的图片,解析出图片片的内容,这种技术叫叫什么? A.图片识别B.语音识别C.自动驾驶D.消费金融46、IBM的的()是第一个在在国际象棋上上战胜人类 人工智能计算机机。A. A
12、lphagooB. 深蓝C.图灵机模型型D.深度学习机机器人47、下列选项项中,不是人工智智能的基础设设施的是? A.CPU服务务器B.GPU服务务器C.专用芯片D.游戏显卡48、以下哪个个不属于大数数据在电信行行业的应用? A数据商业化B.物流网络C.企业运营管管理D.客户关系管管理49、客服中心心是运营商和和客户接触较较为频繁的通通道,我们可以利利用()在后端给客客服中心建立立庞大的知识识库,供接线员们们使用帮忙他他们快速精准准的找到答案案。 A.大数据技术术B.客户画像C.客户状态D.客户心情50、IBM提提出的大数据据5V特征包括()、更快( vellocityy)、更多( Varie
13、tty)、更值钱(Value)和更真实( Veraacity) A.更有效B.更大(Voolume)C.更充分D.更直观51、Fumee采用了三层层架构,分别为 agennt, coollecttor和()A.MapB. storrageC. ShufffleD.Hash52、 Haddoop2系列版本中中默认的HDFS的block是多大?A32MBB.64MBC.128MBBD. 16MBB53、工信部官官网正式发布布大数据产业业“一三五“发展规划是是在哪一年A.1987B.1997C.2007D.201754、BP神经经网络的学习习规则是? A.梯度上升法法B.梯度下降法法C.梯度提升法法
14、D.梯度曲线法法55、中国移动动研发了智能能客服问答机机器人(),使业务流程程自动化,更加智能的的回答用户解解决业务咨询询、业务办理理、流量查询询等问题。A.精灵B.阿尔法蛋C.小度D.移娃56、对抗学习习中两个网络络互相竟争,一个负责生生成样本,那么另一个个负责做什么么? A.判别样本B.计算样本C.统计样本D.生成样本57、以下应用用没有使用你你的地理位置置信息的是? A.美团B.滴滴C.高德地图D.word58、下列选项项中,不是大数据据发展趋势的的是 A.大数据分析析的革命性方方法出现B.大数据与云云计算将深度度融合C.大数据一体体机将陆续发发布D.大数据未来来可能会被淘淘汰59、在
15、Sppark的软件栈中,用于图计算算的是A. Sparrk StrreaminngB.MllibbC. GrapphXD. SparrkSQL60、 HBAASE的特点不包包括哪些?A.面向行B.稀疏性C.多版本D.高可靠性61、总体来说说,人工智能发发展的未来趋趋势是? A.上升B.下降C.不动D.大幅度下降降62、以下数据据单位从小到到大排列的顺顺序是? A.GB、B、KBB.B、KB、MBC.KB、ZBB、PBD. B、 MMB、KB63、最初的大大数据概念还还比较模湖,只是隐约的的知道像个性性化推荐、搜搜索引擎之类类的处理需要要大量数据,那么在搜索索引擎方面,谁是世界上上最大的厂商商?
16、 A.谷歌B.百度C.360D.bing64、下列选项项中,哪个不是 HBASSE的特点?A面向行B.多版本C.扩展性D.稀疏性65、下列选项项中,不是用于数数据存储的技技术是哪一个个?A.MongooDBB.MySQLLC.HDFSD.Java二、多选题1、在数据清洗洗的过程中,总共可以归归为三个阶段段,它们分别是?A.数据加 工工B.数据质量检检查C.数据校对D.数据标准化化2、 HBASSE的特点不包包括哪些?A.面向行B.稠密性C.多版本D.高可靠性3、麦肯锡全球球研究所对大大数据的定义义是种规模大到到在获取、存存储、管理、分分析方面大大大超出了传統統数据库软件件工具能力范范围的数据集
17、集合,具有以下哪哪些特征?A.海量的数据据规模B.快速的数据据流转C.多样的数据据类型D.价值密度低低4、以下哪两项项是人工智能能发展的标志志性产品? A.深蓝alphagooC.智能门禁D.智能手机5、在非电信领领域,大数据可被被应用到的以以下哪些方面面 A.公共安全B.无明显应用用C.智能运输D.智能建筑6、大数据应用用领域成就有有哪些? A.金融B.互联网电子子商务C.工业生产D.没有明显成成就7、以下属于计计算机视觉的的研究方向的的有? A.物体识别和和检测B.语音导航C.视觉问答(看看图说话)D.机器翻译8、传统的机器器学习算法可可以分为哪三三类? A.监督学习B.无监督学习习C.半
18、监督学习习D.强化学习9、在人工智能能发展历程中中有过多次低低谷期,这些低谷期期最主要的两两项原因是什什么? A.运算力不足足B.人员不足C.技术瓶颈D.费用太高10、 HBAASE的应用场景景有哪些?A.半结构化或或非结构化数数据B.记录非常稀稀疏C.结构化数据据D.超大数据量量11、使用有监监督学习的问问题可以被分分为哪两类? A.回归问题B.抽样问题C.聚类问题D.分类问题12、下列选项项属于人工智智能的基本概概念有 A.机器学习B.深度学习C.BP神经网网络D.卷积神经网网络13、 HBAASE的应用场景景有哪些?A.半结构化或或非结构化数数据B.记录非常稀稀疏C.结构化数据据D.超大
19、数据量量14、下列选项项中,是大数据发发展趋势的是是 A.开源大数据据商业化进一一步深化B.打包的大数数据行业分析析应用开拓新新市场C.大数据细分分市场规模进进一步增大D.大数据推动动公司并购的的规模和数量量进一步提升升15、人工智能能关键技术框框架主要包括括哪两层? A.基础设施B.算法C.技术D.人员16、20100年12月,工信部发布布的物联网十十二五规划上上,把信息处理理技术作为4项关键技术术创新工程之之一被提出来来,其中包括了了哪些大数据据的重要组成成技术? A.海量数据存存储B.数据挖掘C.图像视频智智能分析D. pythhon17、世界经济济论坛以“大数据的回回报与风险”主题发布
20、了了全球信息息技术报告(第13版),通过该报告,各国政府逐逐渐认识到大大数据在哪些些方面有重大大意义? A.推动经济发发展B.改善公共服服务C.增进人民福福祉D.保障国家安安全18、下列选项项中,哪两项项是可以用于于数据采集的的技术? A. FlummeB. HiveeC. KafkkaD.Mahouut19、关于RDDD,说法正确的的两项是?A.RDD不能能由多个分区区( parrtitioon)组成B.弹性、集中中式内存集C.RDD能生生成 ChilldrenRRDDD.是一个容错错的、并行的的数据结构20、以下用到到语音识别技技术的应用包包括:A.苹果手机ssiriB.微信C.百度地图D
21、.word21、人工智能能目前在以下下哪三个领域域有了长足的的发展?A.健康B.教育C.探索太空D.理财22、HDFSS适用于什么么样的应用场场景?A.存储和管理理PB级别的数据据B.处理非结构构化数据C.注重数据处处理的吞吐量量D.大量小文件件23、Flumme采用了三层层架构,每一层均可可以水平扩展展,它们分别是?A. agenntB. colllectorrC.storaageD. sourrce24、 KAffak的总体数据据流有三个关关键角色,它们分别是是A. ProdducerB.MessaageC. ClussterD. Conssumer25、业务运营营监控,可以基于大大数据分
22、析从从下列哪三个个维度为运营营商监控管道道和客户运营营情况? A.网络B.业务C.气候D.用户26、自然语言言处理的主要要难点不包括括以下哪两项项 A.语言独立性性B.语言歧义性性C.多国语言D.语境27.以下数据据量不能说成成大数据的是是? A.100MBBB.1000KKBC.100PBBD. 1EB28、以下哪些些属于大数据据在电信行业业的应用? A.网络管理和和优化B.数据商业化化C.客户关系管管理D.企业运营管管理29、通过地理理位置信息可可以分析出哪哪些信息? A.颜值B.家庭住址C.工作地址D.体重30、人工智能能技术的基础础设施不包括括哪两部分? A.系统应用B.机器学习算算法
23、C.基础硬件D.算法框架31、自然语言言处理需要解解决的难点有有哪些? A.语言歧义性性B.语言鲁棒性性C.知识依赖D.语境32、HDFSS在哪些场景景中表现很差差? A.大量小文件件B.随机读取C.修改文件D.存储和管理理PB级别数据33、大数据的的业务应用处处理需要经过过哪些流程? A.数据采集B.数据清洗C.数据建模D.数据加工34、HDFSS适用于哪些些场景?A.大量小文件件B.存储和管理理PB级别数据C.一次写入,多次读取D.低延迟读取取35、人工智能能在哪些领域域应用广泛? A.健康医疗B.智能投顾C.智能教育D.智能法务36、以下哪两两个属于大数数据特征? A.数据体量大大B.价
24、值密度高高C.数据种类多多D.处理速度慢慢37、数据建模模目前有两种种比较通用的的方式,分别是? A.通用建模B.专属建模C.范式建模D.维度建模38、以下应用用使用了你的的地理位置信信息的是? A. 滴滴B. 百度地图C. worddD. exceel39、BP神经经网络模型拓拓扑结构包括括? A.输入层B.隐层C.输出层D.显层40、 HBaase是在 Hadooop之上构建的的开源分布式式结构化数据据存储系统,它有哪些特特点?面向列存储A.非关系型B.面向列存储储C.关系型D.面向行存储储41、大数据可可以被应用到到的行业有?A.电信B.工业C.政府D.金融参考答案单选题1、A 22、A
25、 3、A 4、B5、C 6、D 7、A 8、A 9、D10、A 111、A 12、A 13、B 14、C 15、C 16、D 17、D18、B 19、C 20、B 21、A 22、B 23、A 24、A 25、B26、A 227、B 28、A 29、D 30、C 31、C 32、B 33、C 34、A 335、C 36、C 37、D 38、D 39、B 40、A 41、A42、C 443、C 44、C 45、A 46、B 47、D 48、B 49、A 50、B 51、B 52、C 53、D 54、B 55、D 56、A57、D 58、D 59、C 60、A 61、A 62、B 63、A 64、A 65、D多选题1、BCD 2、AB 3、ABCD4、CD 5、ACD6、ABC 7、AC 8、ABC 9、AC 10、ABD 11、AD 12、ABCD13、ABD14、AC 15、BC 16、ABC 17、ABCD 18、AC19、CD20、ABC21、ABD22、AC 23、ABC 24、ACD 25、ABD 26、AC 27、AB 28、ABCD 29、BC 30、AC31、ACD32、AC33、ABCDD 34、BC 35、ABCD36、AC 37、CD 38、AB 39、ABC40、AB41、ABCD