《模式识别支持向量机SVM课件优秀PPT.ppt》由会员分享,可在线阅读,更多相关《模式识别支持向量机SVM课件优秀PPT.ppt(25页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、内容SVM的理论基础线性判别函数和判别面最优分类面支持向量机SVM的理论基础传统的统计模式识别方法只有在样本趋向无穷大时,其性能才有理论的保证。统计学习理论(STL)探讨有限样本状况下的机器学习问题。SVM的理论基础就是统计学习理论。传统的统计模式识别方法在进行机器学习时,强调阅历风险最小化。而单纯的阅历风险最小化会产生“过学习问题”,其推广实力较差。推广实力是指:将学习机器(即预料函数,或称学习函数、学习模型)对将来输出进行正确预料的实力。SVM的理论基础“过过学学习问题习问题”:某些状况下,当:某些状况下,当训练误训练误差差过过小反而会小反而会导导致推广致推广实实力的下降。力的下降。例如:
2、例如:对对一一组训练样组训练样本本(x,y),x分布在分布在实实数范数范围围内,内,y取取值值在在0,1之之间间。无。无论这论这些些样样本是由什么模型本是由什么模型产产生的,我生的,我们总们总可以用可以用y=sin(w*x)去去拟拟合,使得合,使得训练误训练误差差为为0.SVM的理论基础依据统计学习理论,学习机器的实际风险由阅历风险值和置信范围值两部分组成。而基于阅历风险最小化准则的学习方法只强调了训练样本的阅历风险最小误差,没有最小化置信范围值,因此其推广实力较差。Vapnik 与1995年提出的支持向量机(Support Vector Machine,SVM)以训练误差作为优化问题的约束条
3、件,以置信范围值最小化作为优化目标,即SVM是一种基于结构风险最小化准则的学习方法,其推广实力明显优于一些传统的学习方法。SVM的理论基础由于SVM 的求解最终转化成二次规划问题的求解,因此SVM 的解是全局唯一的最优解SVM在解决小样本、非线性及高维模式识别问题中表现出很多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中.线性判别函数和判别面一 个 线 性 判 别 函 数(discriminant function)是指由x的各个重量的线性组合而成的函数 两类状况:对于两类问题的决策规则为假如g(x)=0,则判定x属于C1,假如g(x)=0,则判定x属于C1,假如g(x)0是一个常数
4、,它限制对错分是一个常数,它限制对错分样本惩处的程度。样本惩处的程度。支持向量机上节所得到的最优分类函数为:该式只包含待分类样本与训练样本中的支持向量的内积运算,可见,要解决一个特征空间中的最优线性分类问题,我们只须要知道这个空间中的内积运算即可。对非线性问题,可以通过非线性变换转化为某个高维空间中的线性问题,在变换空间求最优分类面.这种变换可能比较困难,因此这种思路在一般状况下不易实现.支持向量机核:支持向量机支持向量机核函数的选择支持向量机SVM方法的特点非线性映射是SVM方法的理论基础,SVM利用内积核函数代替向高维空间的非线性映射;对特征空间划分的最优超平面是SVM的目标,最大化分类边
5、界的思想是SVM方法的核心;支持向量是SVM的训练结果,在SVM分类决策中起确定作用的是支持向量。SVM是一种有坚实理论基础的新颖的小样本学习方法。它基本上不涉及概率测度及大数定律等,因此不同于现有的统计方法。从本质上看,它避开了从归纳到演绎的传统过程,实现了高效的从训练样本到预报样本的“转导推理”(transductiveinference),大大简化了通常的分类和回来等问题。支持向量机SVM方法的特点SVM的最终决策函数只由少数的支持向量所确定,计算的困难性取决于支持向量的数目,而不是样本空间的维数,这在某种意义上避开了“维数灾难”。少数支持向量确定了最终结果,这不但可以帮助我们抓住关键样本、“剔除”大量冗余样本,而且注定了该方法不但算法简洁,而且具有较好的“鲁棒”性。这种“鲁棒”性主要体现在:增、删非支持向量样本对模型没有影响;支持向量样本集具有确定的鲁棒性;有些成功的应用中,SVM方法对核的选取不敏感。支持向量机SVM本质上是两类分类器.常用的SVM多值分类器构造方法有: