《判别分析 .ppt》由会员分享,可在线阅读,更多相关《判别分析 .ppt(49页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、判别分析,实例1:某医院对若干个健康人和心肌梗塞病人的心电图作了对比分析,结合专业知识,找出了区分两者的一些指标(X1、X2、X3)。随机抽取10名健康人和6名病人(作为例子,仅抽取了16个样品)。目的:通过心电图指标,判断某个体归属于健康人还是心肌梗塞病人,实例1资料(g=1:健康人,g=2:病人,判别分析,实例 P51 例1: 根据X1-X7值判别某病人疾病类型: 卡他性? 蜂窝组织炎? 坏疽性? 腹膜炎?,判别分析,概念有N个分别属于1、2、G的不同类别样品,每个样品具有X1、X2、Xm个指标,按照一定原则,拟合判别函数,用以判别新样品的类别的多元统计分析方法。1936年R.A.Fish
2、er首次提出,随着计算机的发展而被广泛应用。,判别分析遵循的原则,随机化 对每一待判的个体X,建立一组概率函数,1(X), 2(X), g(X), i(X)0, 且 i(X)=1。将具有观测值X(x1,x2,xm)的个体以概率i(X)化归到第i个总体。非随机化 由个体X的一切可能值构成样本空间S,将S划分为g个互相排斥的区域1、2 g ,若某个体观测值X(X1、X2、Xm)落在i中,则将该个体判属第i总体,判别分析分类,按个体属性(归属类别)数量: 两类判别 多类判别按判别指标(X)性质 计数资料判别 计量资料判别:一般判别 逐步判别,判别分析资料预处理,对于计量资料判别,需对少数计数资料进行
3、量化。对于计数资料判别,需对少数计量资料转换成等级资料,判别分析,本教学讲解内容计数资料最大似然法判别分析计量资料两类Fisher判别分析计量资料多类Bayes判别分析,计数资料最大似然法判别分析,资料要求判别指标全部或大部分是定性和(或)等级指标,如有少量定量指标,则转换成等级指标。M个判别指标X1、X2、Xm彼此独立。,计数资料最大似然法判别分析步骤,收集具有明确归属类别个体的一批判别指标,X1、X2Xm g,判别指标符合最大似然法资料要求;求各个类别下各判别指标出现各种表现的条件概率,以相应频率估计;建立似然函数,判断个体所属类别 (P51 3.1)判别效果评价,计数资料最大似然法判别分
4、析,实例P51 例1,计数资料最大似然法判别分析,注意事项最大似然法建立在独立事件的概率乘法定理基础上,各判别指标间必须相互独立;归属类别g(1, 2g)间必须互斥;用频率估计条件概率,因此,样本量要足够大;对归属类别的判断具有相对性,当两似然函数Li与Lj接近,结论需慎重。,计量资料两类Fisher判别分析,设有N个样品,分别归属于2个类别,N=n1+n2,m个判别指标为X1、X2Xm,据此,按一定原则建立线性判别函数,并对新样品进行判别的多元统计分析方法。判别函数: Z=C1X1+C2X2+CmXm,Ci:判别系数,反映Xi对判别分类作用的方向和大小, Xi变化1个单位,Z变化Ci 个单位
5、,Ci0, Xi增加,Z增加, CiF0.05(3,12),PF0.05(3,12),P2)个总体符合多元正态分布且协方差矩阵相等。实质问题:推断g个总体是否相同。统计量:2 =-N-1-(m+g)/2*lnU ,=m(g-1) 其中,U= Wij / Tij U:Wilks量, Wij :类内离差阵Wij的行列式 Tij :总的离差阵Tij的行列式,两两分类函数对两类判别效果的F检验,多个分类函数对多类判别效果的2检验结果为2 2,进一步对两两分类函数的判别效果作F检验实质:推断两两总体是否相同统计量(e类与f类总体是否相同的检验) Fef=D2ef*(N-g-m+1)nenf /(m(N-g)(ne + nf ) D2ef=mi=1(Cie-Cif)(Xie-Xif),Bayes判别分析,实例 P56,逐步判别分析,目的:对变量进行筛选,使保留在判别函数中的变量判别能力均有统计学意义,剔除在判别函数外的变量判别能力均无统计学意义。方法:最优子集法、向前法、向后法、逐步法,逐步判别分析,实例P70,