《2023年模式识别 复习笔记.pdf》由会员分享,可在线阅读,更多相关《2023年模式识别 复习笔记.pdf(8页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精心整理 欢迎下载 第一章 概论 什么是模式识别?使计算机模仿人的感知能力,从感知数据中提取信息(判别物体和行为)的过程。(老师的简略说法:用机器判断事物类别)模式识别系统主要由四个部分组成:原始数据的获取和预处理,特征提取与选择,分类或类聚,后处理。紧致性:做模式识别的前提条件是每个模式类满足紧致性。相似性度量满足的条件:1234 点 一些专业术语的中英文:PR(pattern recognition)模式识别 BP(back-propagation)反向传播算法 PCA(principal component analysis)主成分分析 NN(neural networks)神经网络 欧
2、式距离:Txuxu 马氏距离:1Txuxu 第二章 贝叶斯决策(两大贝叶斯决策=最小错误率贝叶斯决策+最小风险贝叶斯决策):精心整理 欢迎下载 贝叶斯决策的三个前提条件:类别数确定,各类的先验概率 p(wi)已知,各类的条件概率密度函数 p(x|wi)已知。最小错误率贝叶斯决策:使错误率最小的分类决策。对应于最大后验概率。贝叶斯公式:P17 白细胞例子 最小风险贝叶斯决策:考虑各种错误造成损失不同时的一种最优决策。选择分类或类聚后处理紧致性做模式识别的前提条件是每个模式类满足贝叶斯决策最小风险贝叶斯决策精心整理欢迎下载贝叶斯决策的三个前子最小风险贝叶斯决策考虑各种错误造成损失不同时的一种最优决
3、策精精心整理 欢迎下载 第三章 最大似然估计(两大参数估计=最大似然估计+贝叶斯估计):最可能出一题最大似然估计的计算题。判断估计好坏的标准:无偏性、有效性、一致性。最大似然估计的求解 流程:1、构造似然函数 2、对数化 3、求偏导 4、求解 第四章 线性分类器 Fisher 判别法 Fisher 准则:找到一个最合适的投影轴,使两类样本在该轴上的投影之间的距离尽可能远,而每一类样本的投影尽可能紧凑,从而使分类效果为最佳。各类样本均值向量 mi 判定函数 J(w)越大,说明分子类间距离越大,分母类内距离越小。符合 fisher 准则。引入拉格朗日函数:选择分类或类聚后处理紧致性做模式识别的前提
4、条件是每个模式类满足贝叶斯决策最小风险贝叶斯决策精心整理欢迎下载贝叶斯决策的三个前子最小风险贝叶斯决策考虑各种错误造成损失不同时的一种最优决策精精心整理 欢迎下载 求偏导 最小二乘法 y=ax+b 第五章 非线性分类器 反向传播算法 BP:选择分类或类聚后处理紧致性做模式识别的前提条件是每个模式类满足贝叶斯决策最小风险贝叶斯决策精心整理欢迎下载贝叶斯决策的三个前子最小风险贝叶斯决策考虑各种错误造成损失不同时的一种最优决策精精心整理 欢迎下载 1.三层结构 2.简述 BP 过程、偏差回来调整权系数 P95 3.学习规则:a.随机给定权系数;b.计算输出;c.得到偏差;d.进行调整 4.算法步骤:
5、第七章 特征选择 遗传算法过程:a.初始化:设置进化代数计数器 t=0,设置最大进化代数 T,随机生成 M 个个体作为初始群体 P(0).选择分类或类聚后处理紧致性做模式识别的前提条件是每个模式类满足贝叶斯决策最小风险贝叶斯决策精心整理欢迎下载贝叶斯决策的三个前子最小风险贝叶斯决策考虑各种错误造成损失不同时的一种最优决策精精心整理 欢迎下载 b.个体评价:计算群体 P(t)中各个个体的适应度。c.选择:将选择算子作用于群体。选择的目的是把优化的个体直接遗传到下一代或通过配对交叉产生新的个体再遗传到下一代。选择操作是建立在群体中个体的适应度评估基础上的。d.交叉:将交叉算子作用于群体。作为交叉是
6、指把两个父代个体的部分结构加以替换重组而生成新个体的操作。遗传算法中起核心作用的就是交叉算子。e.变异:将变异算子作用于群体。即是对群体中的个体串的某些基因座上的基因值变动。群体 P(t)经过选择、交叉、变异运算之后得到下一代群体 P(t+1)。f.终止条件判断:若 t=T,则以进化过程中所得到的具有最大适应度个体作为最优解输出,终止计算。(终止条件:达到适应度函数或达到进化规定的代数)第八章 特征提取 PCA(主成分分析)K-L变换(最优正交线性)(完整掌握)选择分类或类聚后处理紧致性做模式识别的前提条件是每个模式类满足贝叶斯决策最小风险贝叶斯决策精心整理欢迎下载贝叶斯决策的三个前子最小风险
7、贝叶斯决策考虑各种错误造成损失不同时的一种最优决策精精心整理 欢迎下载 结合 KL 变换叙述人脸识别的经典流程:1.对向量 x 用确定的完备正交归一向量基 uj 展开,对应到的人脸识别问题上就是一个脸可以由无穷多个本征脸进行重构;2.用有限项估计 X,对应人脸识别时一个脸由有限个本征脸进行重构,假设有 d 个,则;3.下面是寻找 uj,即对应的本征脸;4.由于是用 d 个本征脸来重构一张脸 x,所以存在一定的误差。求估计的均方误差:选择分类或类聚后处理紧致性做模式识别的前提条件是每个模式类满足贝叶斯决策最小风险贝叶斯决策精心整理欢迎下载贝叶斯决策的三个前子最小风险贝叶斯决策考虑各种错误造成损失
8、不同时的一种最优决策精精心整理 欢迎下载 第九章 非监督模式识别 K 均值聚类 基本思想:k 均值聚类是最著名的划分聚类算法,由于简洁和效率使得他成为所有聚类算法中最广泛使用的。给定一个数据点集合和需要的聚类数目 k,k 由用户指定,k 均值算法根据某个距离函数反复把数据分入 k 个聚类中。K 均值的迭代思想:K 均值算法:先随机选取 K 个对象作为初始的聚类中心。然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。一旦全部对象都被分配了,每个聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是以下任何一个:1)没有(或最小数目)对象被重新分配给不同的聚类。2)没有(或最小数目)聚类中心再发生变化。3)误差平方和局部最小。优点:直观 缺点:初始点很重要,对分类有影响,可能掉进局部优解,影响速度效率;类的个数未知 选择分类或类聚后处理紧致性做模式识别的前提条件是每个模式类满足贝叶斯决策最小风险贝叶斯决策精心整理欢迎下载贝叶斯决策的三个前子最小风险贝叶斯决策考虑各种错误造成损失不同时的一种最优决策精