《(1.13)--5.1数据预处理概述.ppt》由会员分享,可在线阅读,更多相关《(1.13)--5.1数据预处理概述.ppt(8页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
数据预处理BIG DATABIG DATA大数据,成就大未来!BIG DATABIG DATA1 数据预处理概述2 数据清理3 数据集成4 数据归约5 数据变换大数据,成就大未来!1 数据预处理概述数据预处理1.1 数据质量数据质量涉及因素准确性完整性一致性时效性可信性可解释性大数据,成就大未来!1 数据预处理概述数据预处理1.1 数据质量大数据,成就大未来!1 数据预处理概述数据预处理1.1 数据质量数据质量涉及因素准确性完整性一致性时效性可信性可解释性name=数据收集工具问题数据输入时人和计算机错误数据传输中产生错误不一致的代码大数据,成就大未来!1 数据预处理概述数据预处理1.2 数据预处理的主要任务数据清理:填写缺失的值,光滑噪声数据,识别或删除离群点,并解决不一致性数据集成:集成多个数据库、数据立方体或文件大数据,成就大未来!1 数据预处理概述数据预处理1.2 数据预处理的主要任务数据规约:得到数据集的压缩表示,它小得多,但能够产生相同或相近的结果。数据变换与离散化:规范化,数据离散化和概念分层BIG DATABIG DATA感谢您的观看!