《《应用多元分析》第三版PPT(第五章).ppt》由会员分享,可在线阅读,更多相关《《应用多元分析》第三版PPT(第五章).ppt(70页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第五章 判别分析v 5.1 引言v 5.2 距离判别v 5.3 贝叶斯判别v 5.4 费希尔判别5.1 引言v 判别分析的例子:1.有偿付力与无偿付力的财产责任保险公司。测量变量:总资产,股票与债券价值,股票与债券的市值,损失支出,盈余,签定的保费金额。2.非溃疡胃病组(胃功能紊乱者)与控制组(“正常”者)。测量变量:焦虑、依赖性、罪恶感、完美主义的量度 3.两种野草。测量变量:萼片与花瓣的长度,花瓣裂缝的深度,苞的长度,花粉直径。4.新产品的速购者与迟购者。测量变量:教育,收入,家庭大小,过去更换品牌的次数。5.良好信用与不良信用风险。测量变量:收入,年龄,信用卡数目,家庭规模。v 判别分析
2、要解决的问题是,在已知历史上用某些方法已把研究对象分成若干组的情况下,来判定新的观测样品应归属的组别。v 每一组(亦称类或总体)中所有样品的p维指标值 构成了该组的一个p元总体分布,我们试图主要从各组的总体分布或其分布特征出发来判断新样品x是来自哪一组的。v 本章介绍三种常用的判别分析方法:距离判别、贝叶斯(Bayes)判别和费希尔(Fisher)判别。5.2 距离判别v 一、两组距离判别v 二、多组距离判别一、两组距离判别v 设组1和2的均值分别为1和2,协差阵分别为1和2(1,20),x是一个新样品(p维),现欲判断它来自哪一组。v 1.1=2=时的判别v 2.12时的判别1.1=2=时的
3、判别v 判别规则:v 令,其中,则上述判别规则可简化为v 称W(x)为两组距离判别的(线性)判别函数,称a为判别系数。误判概率v 误判概率v 设1Np(1,),2Np(2,),则其中 是两组之间的马氏距离。v 可见,两个正态组越是分开(即 越大),两个误判概率就越小,此时的判别效果也就越佳。当两个正态组很接近时,两个误判概率都将很大,这时作判别分析就没有什么实际意义了。组之间是否已过于接近的界定v 我们可对假设H0:1=2,H1:12进行检验,若检验接受原假设H0,则说明两组均值之间无显著差异,此时作判别分析一般会是徒劳的;若检验拒绝 H0,则两组均值之间虽然存在显著差异,但这种差异对进行有效的判别分析未必足够大(即此时作判别分析未必有实际意义),故此时还应看误判概率是否超过了一个合理的水平。v 例5.2.1 设p=1,1和2的分布分别为N(1,2)和N(2,2),1,2,2均已知,12,则判别系数a=(12)/20,判别函数:判别规则:误判概率:误判概率图示:抽取样本估计有关未知参数v 设 是来自组1的样本,是来自组2的样本,n1+n22p,则1和2的一个无偏估计分别为 的一个联合无偏估计为其中