《PCA降维降噪原理及应用ppt课件.pptx》由会员分享,可在线阅读,更多相关《PCA降维降噪原理及应用ppt课件.pptx(20页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、基于基于PCAPCA的降维处理的降维处理原创作者本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。1 PCA2 PCA降维原理3 PCA降维应用4 总结目录目录本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。思考:1)特征重合问题 单位不一致2)特征相关 大小 房间数3)特征多导致过拟合 租房问题4)样本噪声干扰1 PCA1 PCA 1.1 1.1 1.1 1.1
2、 引入引入引入引入合并特征 降维 滤波去噪PCA +降维、降噪本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。PCA(Principal Component Analysis)是一种常用的数据分析方法。PCA通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量,常用于高维数据的降维。即成为主成分的信息分量之间互不相关(主成分 就是线性变换后互相不相关的一组向量)1 PCA 1 PCA 1.2 1.2 1.2 1.2 定义定义定义定义本标准适用于已投
3、入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。1 记录 来自同一个样本的各个特征维度信息;在矩阵中构成列2 字段 各个样本在同一个特征维度上的信息;在举证中构成行3 矩阵基 任何一组线性不相关的向量 (1,1)(1,-1)4 M个N维的样本点=M个样本 N 个特征维度=NxM 的举证2 2 基于基于PCAPCA降维的原理降维的原理 2.1 2.1 2.1 2.1 名词解释名词解释名词解释名词解释日期浏览量访客数下单数成交数成交金额120112525122134511023558054457记
4、录、列字段、行本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。两个矩阵相乘的意义是将右边矩阵中的每一列列向量变换到左边矩两个矩阵相乘的意义是将右边矩阵中的每一列列向量变换到左边矩阵中每一行行向量为基所表示的空间中去;阵中每一行行向量为基所表示的空间中去;如果(如果(R R 降维降维 。满足保留主成分&降维=变换矩阵E 需要满足什么要求呢?2 2 基于基于PCAPCA降维的原理降维的原理 2.2 2.2 2.2 2.2 降维原理降维原理降维原理降维原理本标准适用于已投入商业运行的
5、火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。至此,我们得到了降维问题的优化目标:将一组将一组N N维向量降为维向量降为K K维维(K K大于大于0 0,小于,小于N N),其目标是选择),其目标是选择K K个单位正交基,使得原始数据变个单位正交基,使得原始数据变换到这组基上后,各字段两两间(不同维度间)协方差为换到这组基上后,各字段两两间
6、(不同维度间)协方差为0 0,而字段,而字段(同一个维度上的样本点间)的方差则尽可能大(同一个维度上的样本点间)的方差则尽可能大。2 2 基于基于PCAPCA降维的原理降维的原理 2.3 2.3 2.3 2.3 降维过程降维过程降维过程降维过程寻找K个向量基,使得样本点在K个向量基上投影点间的方差最大,协方差最小本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。例例本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热
7、锅炉以及联合循环机组可参照本标准执行,并增补指标。本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。2 2 基于基于PCAPCA降维的原理降维的原理 2.4 2.4 2.4 2.4 降维步骤降维步骤降维步骤降维步骤EK 的选择由具体要求,结合贡献率而定 P=本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供
8、热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。3 3 基于基于PCAPCA降维的应用降维的应用 3.1 3.1 3.1 3.1 二维降一维二维降一维二维降一维二维降一维5个样本点 2个特征本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。本标准适用于已投入商
9、业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。3 3 基于基于PCAPCA降维的应用降维的应用 3.2 3.2 3.2 3.2 特征降维特征降维特征降维特征降维4个特征:花萼长度、花萼宽度、花瓣长度、花瓣宽度3个分类:山鸢尾、变色鸢尾、维吉尼亚鸢尾本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。第三步 计算协方差第四步 特征值及特征向量本标准适用于已投入商业运行的火力发电厂纯凝式
10、汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。第五步 原数据在新坐标系下的投影 PS:这里的特征已经不再对应原始数据的特征花萼长度、花萼宽度、花瓣长度、花瓣宽度,而是经过降维后的数据是在新的坐标系下描述的数据。本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。设有带噪声信号 把有用信号理解为主要维度,噪声与有用信号的相关性不大,在特征分解之后,去掉多余维度,达到去噪的目的。求解过程:取100个样本,每个样
11、本采样点1000,即100个1000个特征值的矩阵,求协方差及特征值,取特征值最大的主分量3 3 基于基于PCAPCA降维的应用降维的应用 3.33.33.33.3去噪去噪去噪去噪本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。矩阵线性变换EA=X单位矩阵EE的求解过程,即PCA求解步骤4 4 总结总结优点:PCA是一种无参数技术,也就是说面对同样的数据,如果不考虑清洗,谁来做结果都一样,没有主观参数的介入,所以PCA便于通用实现,但是本身无法个性化的优化缺点:PCA假设数据各主特征是分布在正交方向上,如果在非正交方向上存在几个方差较大的方向,PCA的效果就大打折扣了。可以很好的解除线性相关,但是对于非线性相关或者高阶相关特征就需要基于核函数的PCA。