AI-第6章机器学习（3）-统计学习.pptx-淘文阁

资源描述

《AI-第6章机器学习（3）-统计学习.pptx》由会员分享，可在线阅读，更多相关《AI-第6章机器学习（3）-统计学习.pptx（30页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、人工智能导论6.1 概述6.2 决策树学习6.3 贝叶斯学习6.4 统计学习6.5 聚类6.6 特征选择与表示学习6.7 其他学习方法第六章第六章机器学习机器学习6.4 6.4 统计学习统计学习u已知准确的样本分布函数u并且采样无穷多为 u小样本统计学习理论基于对学习错误（过学习，overfitting）和泛化能力之间关系的定量刻画，u不仅避免了对样本点分布的假设和数目要求，u还产生了一种新的统计推断原理结构风险最小化原理。46.4.1 6.4.1 统计学习理论统计学习理论（1）G表示产生器，用于产生输入向量x；（2）S表示被观测的系统或者称为训练器。训练器对每个输入x产生相应的输出y，并且

2、输入和输出遵从某个未知联合概率F(x,y)；（3）LM表示学习机。学习机能够实现一定的函数集f(x,a)，a，其中是学习参数集合，学习参数既可能是向量也可能是函数。不同的a值就决定了不同的学习函数。学习的问题就是从给定的函数集f(x,a)，a中选择出能最好地逼近训练器响应的函数。5期望风险 6常见损失函数常见损失函数经验风险 9小样本统计学习理论u在什么条件下，当样本数目趋于无穷时，经验风险Remp(a)最优值趋于期望风险R(a)最优值（能够推广），其收敛速度又如何。也就是在经验风险最小化原则下的学习一致性条件。u如何从经验风险估计出期望风险的上界，即关于统计学习方法推广性的界。u在对期望风险

3、界估计的基础上选择预测函数的原则，即小样本归纳推理原则。u实现上述原则的具体方法。例如支持向量机（Support vector machine，SVM）就是一个具体的方法。10VCVC维 u对一个指示函数集，如果存在h个样本能够被函数集中的函数按所有可能的2h种形式分开，则称函数集能够把h个样本打散。函数集的VC维就是它能打散的最大样本数目h。u若对任意数目的样本都有函数能将它们打散，则函数集的VC维是无穷大。u有界实函数的VC维可以通过用一定的阈值将它转化成指示函数来定义。11实数平面的VCVC维12u因为总能找出n+1个点，选择其中一个作为原点，剩余n个点的位置向量是线性独立的。但无法选择

4、n+2个这样的点，因为在Rn中没有n+2个向量是线性独立的。uVC维越大则学习机器越复杂，容量越大。u但是一般来说，函数集的VC维与其自由参数的个数不相同。u这给我们克服“维数灾难”创造了一个很好的机会：用一个包含很多参数，但却有较小VC维的函数集为基础构造学习机器会实现较好的推广性。13结构风险 u指示函数集中的所有函数（包括使经验风险最小的函数），经验风险Remp(a)和期望风险R(a)之间以至少1-的概率满足如下关系：14结构风险最小化原则 15u训练数据可以被无错误地划分u并且每一类数据与超平面距离最近的向量距超平面之间的距离最大u对于上式分类边距等于2/|w|u最优超平面就是使分类边

5、距最大的分类超平面166.4.2 6.4.2 支持向量机支持向量机最优分类面17u约束条件为不等式yi(w xi)b10，i=1,2,N 18u其中ai0为拉格朗日系数。L的极值点为鞍点，L求导可得w*和a*：19u其约束条件为 20根据Karush-Kuhn-Tucker(KKT)条件，这个优化问题的解必须满足：由于多数样本所对应的ai将为0，这些样本对于分类超平面根本没有作用。只有当ai不为0时才对分类超平面有用，这些不为0的ai所对应的样本就是支持向量。21u其中，x*+1表示属于第一类的某个（任意一个）支持向量，x*-1表示属于另一类的任意一个支持向量。22线性不可分数据yi(w xi

6、)b 1i，i=1,2,N u其中C被称为惩罚因子。通过改变惩罚因子可以在最大分类间隔和误分率之间进行折衷。23非线性数据非线性问题，SVM通过非线性变换把非线性数据映射到另一个高维空间（特征空间）。即对于线性不可分的样本xRd，作非线性变换:RdH，使得(x)H在特征空间H中是线性可分的。24SVMSVM解决思路25支持向量机与核函数26u将样本空间的内积替换成了核函数，而运算实际上是在样本空间中进行的，并未在特征空间中计算高维向量内积。u满足Mercer条件的函数K(x,y)必定是核函数，也就是肯定存在着一个映射使得K(x,y)=(x)(y)。276.4.3 6.4.3 核函数核函数MercerMercer条件 u函数K(x,y)描述了某个空间中一个内积的充分必要条件是，对于任意给定的函数g(x)，当时，有 28常用的核函数 29待续待续

展开阅读全文

AI-第6章 机器学习（3）-统计学习.pptx

AI-第6章机器学习（3）-统计学习.pptx