《大数据基础与实务(商科版)教学课件.docx》由会员分享,可在线阅读,更多相关《大数据基础与实务(商科版)教学课件.docx(390页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、项目一走进大数据能够运用数据相关基础知识,做好数据分析的全面准备工作能对大数据国家战略、新经济等概念有更准确的认知能根据学习需要查阅相关资料养成用大数据思维去看待问题的习惯养成对事物分析的客观、敏感的职业思维lk-目录qlONETWOTHREEFOURCONTENTS任务描述知识准备课堂研讨拓展训练-e知识准备*现如今社会高速发展,信息技术愈加发达,1大数据越来越受到人们的关注。大数据已成为各E要战略资源,就像计算机和互联网一样,大数据即技术革命。大数据不仅是信息时代的产物;持续高速增长的新引擎,各行各业的决策正在由f转变为“数据驱动。张明是电子商务专业的在校大学生,张明认为要想深入了解大数据
2、,首先要掌握数数据的概念.、数据是指对客观事件进行记录并可以鉴华为 P40Pro e品牌:华为型号:P40 Pro屏幕尺寸:6.58英寸其他参数:摄像头5个,10倍光学变焦,100倍数字变焦,运行内存8G ,机身内容512G别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合,是可识别的、抽象的符号。文本记载和储存文字信息图片由图形、图像等构成的平面媒体音频可分为声音文件和MIDI文件视频各种动态影像的存储文件数据的组织形式-,文件系统在计算机中,文件是以文件系统进行管理的,而在文件系统中,数据按其内容、结构和用途组成若干命名的文件。文件一般为某个用户或用户组
3、所有,但可与其他用户共享。知识准备电楚的组织*%i尊星脸氯宜髭g7、%於富V电造缸屋gfffty|3国数据库数据库是按照数据结构来组织、存储和管理数据的仓库。是一个长期存储在计算机内的、有组织的、可共享的、统一管理的大量数据的集合。数据的生命周期0数据采集指新的数据产生或现有数据内容发生显著改变或更新的阶段数据存储指非动态数据以任何数字格式进行物理存储的阶段数据处理指组织机构在内部针对动态数据进行的一系列活动的组合数据的生命周期*-o数据传输指数据在组织机构内部从一个实体通过网络流动到另一个实体的过程数据交换指数据经由组织机构内部与外部组织机构及个人交互过程中提供数据的阶段数据销毁指通过对数据
4、及数据的存储介质通过相应的操作手段,使数据彻底丢失且无法通过任何手段恢复的过程数据的价值数据传输能力数据传输性能决定了部分应用场景的实现,数据实时的调用、加工、算法推荐和预测等数据资产能力数据资产直接变现的价值通过数据资产作为资源加工后提供数据服务的业务价值数据计算能力计算速度就像造血速度一样,决定了供应量。数据算法能力最直接应用于业务场景且更容易被用户感知的数据能力-e课堂研讨m请举例说明大数据对人们日常生活的影响。)01数据有哪些类型?展训练02请简述数据生命周期的各个阶段。lk-目录qlONETWOTHREEFOURCONTENTS任务描述知识准备课堂研讨拓展训练任务描述;I张明很喜欢听
5、音乐,他发现软件会自动推荐一些歌曲,r歌曲的风格大多与他平时常听的类似,非常贴近他喜欢的类型;购物软件也是如此,张明喜欢的电子产品、运动品牌以及书籍的相关链接,也都出现在页面最显眼的地方。iII那么,这些软件的精准推荐跟大数据是否有联系呢?知识准备大数据的概念大数据(bigdata),口行业术语,是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。数据量大Volume价值密度低Value数据类型繁多Variety处理速度快Velocity大数据的特征.、大数据的发展历程二Om萌芽时期一(1990s-2000)1998年,Science杂志发表了一篇题为大数据科学的可视化的文章
6、,大数据作为一个专用名词正式出现在公共期刊上。在这一阶段,大数据只是作为一个概念或假设,少数学者对其进行了研究和讨论,其意义仅限于数据量的巨大。., . . 、( 2000-2010 )在这一阶段,大数据作为一个新名词,开始受到理论界的关注,其概念和特点得到进一步丰富,相关的数据处理技术层出不穷,大数据开始显现出活力。Science杂志推出了一系列大数据专刊,详细讨论了一系列大数据的问题。Hadoop技术应运而生,成为数据分析的主要技术20012005200720082010美国信息技术顾问委员会发布了一份题 为规划数字化未来的报告,详细描 述了政府工作中大数据的收集和使用。.J美国Gartn
7、er公司率先开发了大型数据模型。同年,DougLenny提出了大数据的3V特性数据密集型科学的出现,不仅为科学界提供了一种新的研究范式,而且为大数据的发展提供了科学依据-e课堂研讨m相对于传统数据,大数据对于推动人类社会发展有哪些突出贡献?Jo-01大数据有哪些特征?02简述大数据的发展历程。lk-目录qlONETWOTHREEFOURCONTENTS任务描述知识准备课堂研讨拓展训练任务描述(3推进我国大数据发展和应用,加快建设数据强国,中 五中全 在全面 资源开 型升级。世界各国的大数据国家战略是怎样的呢?张明经常关注国际时政,他注意到大数据对分配、消费活动以及经济运行机制、社会生活方式;等
8、方面产生越来越深远的影响。早在2015年10月26国共产党第十八届中央委员会第五次全体会议(党会)上,“十三五”规划建议提出实施国家大数:放共享,释放技术红利、制度红利和创新红利,至此,大数据战略上升为国家战略。.知识准备.视大数据为重要的战略资源-o美国商业概念一)实施三步走战略国家战略大数据技术研发-商业应用保障国家安全_全球领先优势英国经验结合本国特点和需求加大大数据研发投入强化顶层设计聚焦部分应用领域进行重点突破推动.社会经济生活_信息化战略一大数据产业TL国家功能I(城市管理、公共管理)发展创新性解决方案并应用干实践韩国智能终端普及率大数据发展战略:移动互联网接入速度世界前列数据产出
9、量中世界先进以大数据等应对技术为核心第四次工业革命知识准备开放公共数据,夯实应用开发已发挥了重要作用党的十八届五中全会将大数据上升为国家战略,加快建设数字强国大数据发展日新月异,我们应该审时度势、精心谋划、超前布局、力争主动,深入了解大数据发展现状和趋势及其对经济社会发展的影响,分析我国大数据发展取得的成绩和存在的问题,推动实施国家大数据战略,加快完善数字基础设施,推进数据资源整合和开放共享,保障数据安全,加快建设数字中国,更好服务我国经济社会发展和人民生活改善。-e拓展训练举例说明大数据国家战略对相关领域产生的影响。01请同学们课后查阅资料,了解国家已经发布的大数据战略相关文件。lk-目录q
10、lONETWOTHREEFOURCONTENTS任务描述知识准备课堂研讨拓展训练任务描述(3影响深新经济”大数据、云计算、无人机、3D打印、虚拟抑实、日新月异、层出不穷的新技术、新业态、新产品,引发展的方向。电子商务专业的张明意识到现在越来越了翻天覆地的变化,大数据对于经济社会与人们日入到各个层面,社会对于数据处理能力的需求急剧增也由此诞生。于是,张明开始在网上搜寻有关-e知识准备新经济的概述新经济是指新的经济形式。社会主导产业形态的差异决定了社会经济形态的差异。在不同的历史时期,新经济有不同的内涵。目前,新经济是指创新知识主导知识、创新型产业成为产业领导者的智能经济形式。新经济的基本特征与整
11、个人类社会环境发生的深刻变化相对应呈现给人们的是一个全新经济时代新经济的信息化和网络的快速发展经济呈现全球一体化趋势知识准备.、新经济的 影响与内涵新经济时代的出现不仅给各国的经济发展带来了新的机遇,也给经济不发达国家的企业带来了新的挑战。事实上,历次经济技术革命都在资源配置的手段、方式和效率上产生了巨大的变化,对人们的生活方式产生了深远的影响。知识准备创新的技术经济发展的核心动力与实体经济相结合进而产生新的业态和新的生产方式。创新的技术带动行业和产业发展,新经济必然是围绕创新并引领时代发展的。知识准备.、让给棚I走市场化、企业化的合作之路。新经济背景下的商科教育新一轮的科技革命和产业革命正在
12、进行,互联网、云计算、大数据等新兴技术与模式正深刻改变人们的思维、生产、学习方式。共同探讨、支持新商科人才培养事业的发展,共建现代学习体系,培养大批创新人才,已经成为应对诸多复杂挑战、实现可持续发展的关键。课堂研讨.、大数据是怎样催生新经济的呢?7no为什么说新商科,是在现有商科发展的基础(上,回应科技、社会、经济所带来的挑战?-e拓展训练01请同学们课后查阅有关资料,了解更多有关新经济、新商科的相关内容。项目二大数据与云计算、物联网、人工智能大数据基础与实务二 大数据与云计算、物联网、人工智能能够运用云计算、物联网和人工智能等知识,做好全面准备工作能够掌握大数据与云计算、物联网和人工智能间的
13、关系能根据学习需要查阅相关资料学会思考大数据技术在各个领域的应用潜能和发展前景养成对事物分析的客观、敏感的职业思维云计算物联网境&网的疝用实训百度地图查看实时公交大数据与云计算、物联网 人工智能的关系知识图谱lk-目录qlONETWOTHREEFOURCONTENTS任务描述知识准备课堂研讨拓展训练知识准备的云计算数据中心已经投产使用,此外,华为与英国C华为早在2008年就开始在云计算领域进行投入与幺全国已经有多个云计算节点,是领先的云计算提供商。合作协议,共同迎接云时代下数据中心基础设施领与北京市供销合作总社达成全球合作协议,共建云计算张明想知道什么是云计算,以及云计算有哪.、数据信息层应用
14、软件层中间件层数据库层操作系统层服务器层存储层网络层基础层数据信息卜数据信息层卜I应用软件y软件应用层-1中间件&运行库-平台软件层基础设滞层-数据库操作系统T服务器虚拟机磁盘柜计算机网络机房基础设置A需要注意的是:服务器、虚拟机就包括了CPU、内存,而网络、硬盘其实也是一种计算资源。/IT系统定义传统电脑中输入一个命令,程序会在这台电月中进行计算,最后输出到自己的电脑上,比如用鼠标点击运行浏览器这个命令。而云计算是把整个计算资源放在云端,也就是输入输出与计算分离。输入一个命令后通过网络传输到云端,计算好后再传回来,这就是通俗云计算的概念。电.云计算的联模式野型O服务模式基础设施即服务(laa
15、S )云服务提供商把IT系统的基础设施建设好,并对计算设备进行池化,然后直接对外出租硬件服务器、虚拟主机、存储或网络设施等。平台即服务(PaaS )云服务提供商把基础设施层和平台软件层都搭建好,然后在平台软件层上划分小块(习惯称之为容器)并对外出租,相当于买了一台有操作系统的计算机,可以在这基础上进行应用软件的开发。.、服务模式软件即服务(SaaS )云服务提供商把IT系统的应用软件层作为服务出租出去,而消费者可以使用任何云终端设备接入计算机网络,然后通过网页浏览器或者编程接口使用云端的软件,相当于用户直接拥有一台安装了自己需要的应用程序的计算机。.、0公有云云计算服务由第三方提供商完全承载和
16、管理为用户提供价格合理的计算资源访问服务私有云私有云只为特定用户提供服务混合云在使用私有云作为基础的同时结合了公有云的服务策略,用户可自主切换.、基础设施即服务(laaS)给家里安了自来水,并购买了橘子粉把水净化、烧开,加点橘子粉张明想喝橙汁直接买了楼下已经处理好的纯净水,加点橘子粉平台即服务(PaaS)软件即服务(SaaS)J_/L打电话让楼下的饮料店把张明需要的饮料送到家云计算数据中心,云计算数据中心是一种基于云计算架构骷计算、存储、服务及网络资源的松耦合,各种IT设备虚拟化、模块化程度、自动化程度和绿色节能程度较高的新型数据中心。云计算数据中心高度虚拟化自动化模块化绿色节能金融云教育云/
17、以数据存储和管理为核心的云计算系统,方便了使用者对资源的管理医疗云1使用云计算”来创建医疗健康服务云平台,实现医疗资源的共享和医疗范围的扩大,提供互联网处理和运行服务/共享互联网资源/高效、低成本教育云实质上是指教育信息化的一种发展-e知识准备云计算服务业云计算制造业PART1PART2基础设施服务业支持产业PART3PART4知识准备云计算服务业laaS服务虚拟机、WebHosting和虚拟存储等SaaS服务企业应用、娱乐应 用和办公应用等数据库平台、开发测试、应用部署和行业应用等知识准备云计算制造业软件方面,比如系统集成、软件产业、应用软件、基础软件和中间软件等支持产业硬件方面,比如服务器
18、、网络设备、终端设备和存储设备等。支持产业包括计算的评估认证、设计和咨询等基础设施服务业基础设施服务业包括网络和数据中心。课堂研讨围绕云计算在其他领域的应用展开讨论-e拓展训练01简述云计算的服务模式和类型lk-目录qlONETWOTHREEFOURCONTENTS任务描述知识准备课堂研讨拓展训练任务准备域就会 会告诉张明非常好奇,这是怎样做到的呢?一位护山员在家里手机上看着千里之外的山林起火,他就可以遥控直升飞机前去灭火;消防员可以警电话,因为只要城市里面任何一个区域的温度异常在他们的手机屏幕上显现;驾驶员开车进车库的时房间里面的灯该亮了,或者窗户该打开了。知识准备物联网的概念(ACTION
19、旨将互联网的概念扩展到物理设备和常对象之间的连接中。这些设备嵌入了电子设备、网络连接和其他形式的硬件(如传感器),可以通过网络与其他人通信和交互,并且可以远程监控。L7嗡.物学的关键技%射频识别(RFID)技术通过无线电讯号识别特定目标并读写相关数据,无需识别系统与特定目标之间建立机械或光学接触无线网络技术高速、可进行大批量数据传输的无线网络传感器技术能感受规定的被测量,如温湿度、电压和电流,并按照一定的规律转换成可用输出信号。研究、开发用于模拟、延人工智能技术伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学云计算技术云计算是把一些相关网络技术和计算机发展融合在一起的产物知识准备
20、知识准备物联网产业O制造业下一代的工业革命已经开始,而这样的兴起正是由物联网驱动的。产品和设备都能在使用过程中反馈数据。66%的先行者认为物联网是他们在竞争中取得优势的关键。医疗人口的增加与老龄化正在给医疗带来沉重的负担,而物联网可以起到缓解作用。通过物联网,病人可以选择在家中进行治疗。-e知识准备能源和公共事业物联网能够将更多的能源来源与越来越多的需求建立联系,它还能集成可再生能源实现清洁发电。通过物联网,人们可以实时了解设备的信息,从而减少临时停电造成的影响。O运输及配送物联网将轨迹追踪提高到了一个全新的水平,它使得发货过程中的各个参数都能被记录下来,不仅限于位置,还有温度、湿度、振动和倾
21、斜等等。0农业科技物联网有助于实现精准农业,使播种、灌溉和化肥的使用更加准确。智慧城市物联网可以被用来减少能源使用、管理交通、增加公民安全性。物联网能帮助占全球人口总数一半的城市居民,使其生活变得更轻松、更清洁、更安全、也更愉快。零售物联网一直在改变零售业,使得店内购物体验变得更加个性化,还能通过购买历史行为向顾客推荐可能喜欢”的频道。金融服务在数据驱动的全球金融环境中,物联网有助于提高智能化、降低风险并提供更好的数字化体验。智能家居2018年80%的家电厂商都做了智能家居方面的研发,例如常见的家用扫地机器人,有一半都接入了物联网。-e拓展训练围绕物联网在其他领域的应用展开讨论。01简述物联网
22、的关键技术。lk-目录qlONETWOTHREEFOURCONTENTS任务描述知识准备课堂研讨拓展训练任务准备,消费者的信用评分将起到至关重要的作用。在过去,贷款工作人员审直了这些贷款和信用卡申请。虽.然仍有很多工作人员,但许多关于信用卡的决定或者是否接受消费者的申请,都是由人工智能中的机器学习系统做出来的。银行管理人员可以设置他们希望当前信贷标准是宽松还是紧缩的参数。但他们希望银行的机器学习系统能够随着时间的推移而学习,以便更密切地确定哪些申请人是安全的借贷者。/ail张明想要知道,除了机器学习,人工智能还涉及到哪些关键技术。.、人工智能的概念人工智能(ArtificialIntellig
23、ence),英文缩写为AL它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新技术科学。机器学习是一门涉及统计学、系统辨识、逼近理论、神经网络、优化理论、计算机科学、脑科学等诸多领域的交叉学科知识图谱本质上是结构化的语义知识库,是一种由节点和边组成的图数据结构,以符号形式描述物理世界中的概念及其相互关系自然语言处理研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法人机交互主要研究人和计算机之间的信息交换,主要包括人到计算机和计算机到人的两部分信息交换计算机视觉使用计算机模仿人类视觉系统的科学,让计算机拥有类似人类提取、处理、理解和分析图像以及图像序列的能力
24、。人机交互通过个体生理特征或行为特征对个体身份进行识别认证的技术。人机交互以计算机为核心的新型视听技术。结合相关科学技术,在一定范围内生成与真实环境在视觉、听觉、触感等方面高度近似的数字化环境。.任务准备人工智能的应用智能医院虚拟个人助理人脸识别打拐无人汽车物流机器人除了机器学习,课堂研讨银行业还在哪些方面运用到人工智能?01人工智能与人的智能有什么区别和联系?02简述人工智能的相关技术。lk-目录qlONETWOTHREEFOURCONTENTS任务描述知识准备课堂研讨拓展训练知识准备人工智能的应用从技术上来看,大数据和云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算
25、机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘,但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术等。从应用角度上讲,云计算给大数据提供信息化的基础设施,能更有效利用资源;从产业发展的角度上讲,运用云平台,每天可以处理大批量的数据,并对这些数据进行科学、快速、智能的检索。知识准备目前,物联网正在支撑起社会活动和人们生活方式的变革,被称为继计算机、互联网之后冲击现代社会的第三次信息化发展浪潮。物联网在将物品和互联网连接起来,进行信息交换和通信,以实现智能化识别、定位、跟踪、监控和管理。AIoT体系知识准备-e课堂研讨结合云计算、物联网和人工智能相关知识,展
26、望这三种技术的综合应用前景,并展开讨论。-e拓展训练01大数据与云计算和物联网有哪些区别和联系。大数据采集与清洗大数据基础与实务曲目三大数据采集与清洗能运用大数据采集与清洗的知识,做好大数据清洗与采集的全面准备工作能使用大数据采集工具采集所需数据能准确把握数据清洗的内容和目的能分析数据并定义清洗规则、搜寻并标识错误实例、纠正发现的错误熟练使用数据清洗工具具备大数据平台实践能力知识图谱数亮采更的慨念lk-目录qlONETWOTHREEFOURCONTENTS任务描述知识准备课堂研讨拓展训练任务描述的信息的信息已经*?大数据开启了一个大规模生产、分享和应用数据技术和商业带来了巨大的变化。麦肯锡研究
27、表明,在制造业领域,大数据每年可以提高劳动生产率0.5%在核心领域的渗透速度有目共睹,然而调查显示,比例高达99.4%,很大程度都是由于高价值的信息因此在大数据时代背景下,如何从大数据中采集t是大数据发展的关键因素之-丁勤奋好学的张明找到老师并提问:什么是知识准备定义数据采集就是使用某种技术或手段,数据收集起来并存储在某种设备上。数据采集处于大数据生命周期中的第一个环节,之后的分析挖掘都建立在数据采集的基础上。数据采集技术广泛应用在各个领域,比如摄像头和麦克风,都是数据采集工具。多维性知识准备数据采集的数据源线上行为数据新数据源的归纳与分类页面数据、交互数据、表单数据、会话数据等内容数据2应用
28、日志、电子文档、机器数据、语音数据、社交媒体数据等课堂研讨数据采集的数据源商业数据主要来源于公司业务平台的日志文件以及业务处理系统互联网数据的采集通常是借助于网络爬虫来完成的。所渭网络爬虫,就是T在网上到处或定向抓取网页数据的程序。传感器是一种检测装置,能感受到被测量的信息,并能将感受到的信息,按一定规律变换成为电信号或其他所需形式的信息输出,以满足信息的传输、处理、存储、显示、记录和控制等要求。.、在一些专业二手平台上,网售大数据采集和定制业务颇为盛行。有些从事信息贩卖的“商家,正大肆兜售着覆盖诸多行业的用户信息,内容颇为庞杂,可谓五花八门,无所不包。有的还以行业明码标价,成行成市。这些人打
29、着“专业定制的旗号,无论需要哪类信息,只要客户提出要求,其都能从网上为你采集到。这些数据商的背后隐藏着一条非法获取用户数据的产业链。他们通过专业的“爬虫软件,侵入搜索引擎、企业网页、公众号及微信朋友圈等,采集各类个人信息及实时数据,经过汇总、整理然后生成所谓大数据产品出售。思考:如果任由此类行业继续发展,将会带来怎样的后果?-e拓展训练01请在网上查找有关数据采集的企业应用实例。lk-目录qlONETWOTHREEFOURCONTENTS任务描述知识准备课堂研讨拓展训练任务描述的企业营销的创新模式,能够实现对消费者的需求变 正做到以消费者为导向,从而进行有针对性的市场近年来,由于互联网大数据技
30、术的快速发展,以及消售求不断发生变化,对企业的营销方式也提出了更高的要求网为中心”的营销观念和手段无法适应目前市场和消费者需求多样化发展的形势。某烟草企业就面临这样的问题,想要找到基于大数据采集技术支时把控,真作为一名普通大学生,张明也想为该烟草公司筹谋从寻找合适的数据采集工具与方法开始入手。在上一解到数据采集的数据源主要分为商业数据、互联网数三大类,根据烟草公司的特性,张明想知道,互联网数据的工具及方法有哪些呢?知识准备,士C()Scribe图3-1 Scribe体系架构图Scribe是Facebook开源的日志收集系统,在Facebook内部已经得到的应用,其体系架构如图3-1所示。它能够
31、从各种日志源上收集日志,存储到一个中央存储系统(可以是NFS,分布式文件系统等)上,以便于进行集中统计分析处理。知识准备尊日志收集系统。聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。7图3-2Flume体系架构图知识准备.、-nttpc/wwwa_hnpE/dui-b-hnpr*wwh,tpc/fwaLhttjSRfeMtpMwwwZL.hUpq&swabAtht!p/dlSl.b*u.图3-4八爪鱼采集器工作流程知识准备网络爬虫集搜客采集器是一款简单易用的网页信息抓取软件,能够抓(三
32、)集搜客取网页文字、图表、超链接等多种网页元素。同样可以通过简单可视化流程进行采集,服务于任何对数据有采集需求的人群。山使用向导(可永久关闭,也可通耽里打开)X11.加载网页I2.点选抓内容13.测试,存规则14.蒯进阶1知道了1V在物止栏瑜入网如井回车观察浏览器显示网页进入命名任务工作台/始抓取规则起名字/、在浏览器点击网页内容、;点两下生成标签:给抓取内容起名并提交在DOM恻上点选机细节I181标右腿菜单做动作进入创建规则工作台)点击测试按钮)点击工具条的和数据按钮:11:关阿图3-5集搜客使用向导知识准备网络爬虫Q工作台(拉住此处拖控移沏命名任务创建规则肥虫路线诧统动作搜规则旧名尻取规则
33、必须有名字,右边按钮检查皇百森桧百事名规则编号百事能目谢人.人工根据零要迸行修改选在用载屏口网页快照口高亮显示监听i肖思信主关键词柱式可以蛇入T而述性文字,比如,全义规则中使用的技巧,便于以后修改规则时做参考图3-6集搜客工作台-e课堂研讨哪一种数据采集工具更适合张明?理由是什么?拓展训练.、01尝试使用至少两种工具,采集链家平台广州地区的租房信息数据。lk-目录qlONETWOTHREEFOURCONTENTS任务描述知识准备课堂研讨拓展训练任务描述(3洗数据质量的高低严重影响了工业、经济面,数据质量问题及其所导致的知识和决范围内造成了恶劣的后果,严重困扰着信息:广泛应用对数据质量的保障提出了迫切需求,数据质量管理的重要问题,其内容十分丰实体识别与真值发现,错记的主动发现和修复年张明对此产生了疑惑:什么是数据清;脏数据呢?知识准备数据清洗的概念一C定义数据清洗是一种对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性。知识准备“脏数据的类型这一类数据主要是一些应该有的信息缺失,如供应商的名称、分公司的名称、客户的区域信息缺失、业务系统中主表与明细表不能匹配等。“脏数据”的类型