(1.17)--5.5数据变换大数据分析与挖掘.ppt

上传人:奉*** 文档编号:96400362 上传时间:2023-11-22 格式:PPT 页数:7 大小:959.62KB
返回 下载 相关 举报
(1.17)--5.5数据变换大数据分析与挖掘.ppt_第1页
第1页 / 共7页
(1.17)--5.5数据变换大数据分析与挖掘.ppt_第2页
第2页 / 共7页
点击查看更多>>
资源描述

《(1.17)--5.5数据变换大数据分析与挖掘.ppt》由会员分享,可在线阅读,更多相关《(1.17)--5.5数据变换大数据分析与挖掘.ppt(7页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、数据预处理BIG DATABIG DATA大数据,成就大未来!BIG DATABIG DATA1 数据预处理概述2 数据清理3 数据集成4 数据归约5 数据变换大数据,成就大未来!5 数据变换数据预处理5.1 数据变换策略概述数据变换将数据转换或统一成适合挖掘的形式平滑:去除数据中的噪声,分箱、回归、聚类属性/特征构造:由给定属性构造的新属性并添加到属性集中聚集:汇总,数据立方体的构建规范化:把属性数据按比例缩放,使之落入一个特定的小区间I.最小-最大规范化II.z-score规范化III.小数定标规范化离散化:数值属性的原始值用区间标签或概念标签替换。大数据,成就大未来!5 数据变换数据预处

2、理5.2 通过规范化变换数据最小-最大规范化例:假设属性income的最小值与最大值分别为12000美元和98000美元。我们想把income映射到0.0,1.0。根据最小-最大规范化,income的值为73600美元时将变换为多少?大数据,成就大未来!5 数据变换数据预处理5.2 通过规范化变换数据z-score规范化例:假设属性income的均值和标准差分别为54000美元和16000美元。根据z-score规范化,income的值为73600美元时将变换为多少?大数据,成就大未来!5 数据变换数据预处理5.2 通过规范化变换数据小数定标规范化其中 j 是使得max(|)1的最小整数.例:假设属性A的取值由-986到917。A的最大绝对值为986.根据小数定标规范化,我们用1000(j=3)除以每一个值。因此,-986被规范化为-0.986,917被规范化为0.917.BIG DATABIG DATA感谢您的观看!

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁