《判别分析的一般步骤和SPSS实现ppt课件.ppt》由会员分享,可在线阅读,更多相关《判别分析的一般步骤和SPSS实现ppt课件.ppt(38页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 判别分析的一般步骤及SPSS实现判别分析的逻辑框图o例1:为研究某地区人口死亡状况,已按某种方法将15个已知地区样品分为3类,指标含义及原始数据如下。试建立判别函数,并判定另外4个待判地区属于哪类? X1 : 0岁组死亡概率 X 4 : 55岁组死亡概率 X 2 :1岁组死亡概率 X5 : 80岁组死亡概率 X 3 : 10岁组死亡概率 X6 : 平均预期寿命 判别分析的SPSS实现表7.1 各地区死亡概率表 (一) 操作步骤1. 在SPSS窗口中选择AnalyzeClassifyDiscriminate,调出判别分析主界面,将左边的变量列表中的“group”变量选入分组变量中,将 选入自变
2、量中,并选择Enter independents together单选按钮,即使用所有自变量进行判别分析。图7.2 判别分析主界面X1X62. 点击Define Range按钮,定义分组变量的取值范围。本例中分类变量的范围为1到3,所以在最小值和最大值中分别输入1和3。单击Continue按钮,返回主界面。判别分析的SPSS实现3. 单击Statistics按钮,指定输出的描述统计量和判别函数系数。选中Function Coefficients栏中的Fishers和Unstandardized。这两个选项的含义如下:nFishers:给出Bayes判别函数的系数。(注意:这个选项不是要给出Fi
3、sher判别函数的系数。这个复选框的名字之所以为Fishers,是因为按判别函数值最大的一组进行归类这种思想是由Fisher提出来的。这里极易混淆,请注意辨别。)nUnstandardized:给出未标准化的Fisher判别函数(即典型判别函数)的系数(SPSS默认给出标准化的Fisher判别函数系数)。判别分析的SPSS实现o注:由于SPSS中的判别分析没有距离判别这一方法,因此距离判别法无法在SPSS中直接实现(但可以通过Excel等软件来进行手工计算)。判别分析的SPSS实现o单击Continue按钮,返回主界面。图7.3 Statistics子对话框判别分析的SPSS实现4. 单击Cl
4、assify按钮,定义判别分组参数和选择输出结果。选择Display栏中的Casewise results,输出一个判别结果表,包括每个样品的判别分数、后验概率、实际组和预测组编号等。其余的均保留系统默认选项。单击Continue按钮。图7.4 Classify子对话框5. 单击Save按钮,指定在数据文件中生成代表判别分组结果和判别得分的新变量,生成的新变量的含义分别为:nPredicted group membership:存放判别样品所属组别的值;n Discriminant scores:存放Fisher判别得分的值,有几个典型判别函数就有几个判别得分变量;nProbabilities
5、 of group membership:存放样品属于各组的Bayes后验概率值。o将对话框中的三个复选框均选中,单击Continue按钮返回。判别分析的SPSS实现图7.5 Save子对话框6. 返回判别分析主界面,单击OK按钮,运行判别分析过程。判别分析的SPSS实现(二) 主要运行结果解释1. Standardized Canonical Discriminant Function Coefficients(给出标准化的典型判别函数系数)n标准化的典型判别函数是由标准化的自变量通过Fisher判别法得到的,所以要得到标准化的典型判别得分,代入该函数的自变量必须是经过标准化的。2. Can
6、onical Discriminant Function Coefficients(给出未标准化的典型判别函数系数)n未标准化的典型判别函数系数由于可以将实测的样品观测值直接代入求出判别得分,所以该系数使用起来比标准化的系数要方便一些。见表7.2(a)。判别分析的SPSS实现n由此表可知,两个Fisher判别函数分别为:n实际上两个函数式计算的是各观测值在各个维度上的坐标,这样就可以通过这两个函数式计算出各样品观测值的具体空间位置。 1123456212345674.99 1.8611.6560.8770.7980.0981.57929.482 0.8671.1550.3560.0890.05
7、40.69yXXXXXXyXXXXXX判别分析的SPSS实现表7.2(a) 未标准化的典型判别函数系数判别分析的SPSS实现3. Functions at Group Centroids(给出组重心处的Fisher判别函数值)n如表7.2 (b) 所示,实际上为各类别重心在空间中的坐标位置。这样,只要在前面计算出各观测值的具体坐标位置后,再计算出它们分别离各重心的距离,就可以得知它们的分类了。Functions at Group Centroids-2.5941.0139.194-.257-6.600-.756GROUP1.002.003.0012FunctionUnstandardized
8、canonical discriminantfunctions evaluated at group means表7.2(b) 组重心处的Fisher判别函数值 4. Classification Function Coefficients(给出Bayes判别函数系数)n如表7.3所示,Group栏中的每一列表示样品判入相应列的Bayes判别函数系数。在本例中,各类的Bayes判别函数如下:第一组:第二组:第三组: 11234565317.2 143.9153.190.153.011.0189.3FXXXXXX 21234566202.2 164.7171.2100.062.512.1207.
9、0FXXXXXX 31234564982.9 134.9144.585.950.010.5181.7FXXXXXX判别分析的SPSS实现n将各样品的自变量值代入上述三个Bayes判别函数,得到三个函数值。比较这三个函数值,哪个函数值比较大就可以判断该样品判入哪一类。例如,将第一个待判样品的自变量值分别代入函数,得到: F1=3793.77, F2=3528.32, F3=3882.48n比较三个值,可以看出第一个待判样品应该属于第三组。判别分析的SPSS实现Classification Function Coefficients-143.851-164.691-134.862153.13717
10、1.185144.462-90.088-99.976-85.94553.00962.52549.97211.00812.09410.520189.261207.003181.714-5317.234-6202.158-4982.880X 1X 2X 3X 4X 5X 6(Constant)1.002.003.00G RO U PFishers linear discriminant functions表7.3 Bayes判别法的输出结果判别分析的SPSS实现5. Casewise Statistics(给出个案观察结果)n在Casewise Statistics输出表针对每个样品给出了了大部分
11、的判别结果,其中包括:实际类(Actual Group)、预测类(Predicted Group)、Bayes判别法的后验概率、与组重心的马氏距离(Squared Mahalanobis Distance to Centroid)以及Fisher判别法的每个典型判别函数的判别得分(Discriminant Scores)。出于排版要求,这里给出结果表的是经过加工的,隐藏了其中的一些项目,如表7.4所示。从表中可以看出四个待判样本依次被判别为第三组、第一组、第二组和第三组。判别分析的SPSS实现Casewise Statistics111.000.297-2.1771.364111.000.23
12、6-2.2701.375111.000.117-2.7411.32311.998.507-3.199.638111.000.418-2.582.366221.000.4699.674.231221.000.8688.332-.613221.0005.98510.128-2.518221.0004.7938.3421.760221.000.1019.491-.145331.000.139-6.687-.394331.000.322-7.163-.685331.0005.365-8.655-1.82333.8793.384-4.766-.60833.995.998-5.727-.270ungrou
13、ped31.000361.567-20.714-13.498ungrouped1.998.558-3.319.831ungrouped21.00028.66814.0082.086ungrouped31.0001.982-7.595-1.752CaseNumber12345678910111213141516171819ActualGroupPredictedGroupP(G=g| D=d)SquaredMahalanobisDistance toCentroidHighest GroupFunction1Function2Discriminant Scores表7.4 个案观察结果表6. 由
14、于我们在Save子对话框中选择了生成表示判别结果的新变量,所以在数据编辑窗口中,可以观察到产生的新变量。其中,变量dis-1存放判别样品所属组别的值,变量dis1-1和dis2-1分别代表将样品各变量值代入第一个和第二个判别函数所得的判别分数,变量dis1-2、dis2-2和dis3-2分别代表样品分别属于第1组、第2组和第3组的Bayes后验概率值。判别分析的SPSS实现o例2: 对国家类别的判别判别分析的SPSS实现 14个国家的出生时预期寿命和成人识字率 类别序号国家名称出生时预期寿命(岁)成人识字率(%)第一类(发达国家)1美国76.099.02日本79.599.03瑞士78.099.
15、04阿根廷72.195.95阿联酋73.877.7第二类(发展中国家)6保加利亚71.293.07古巴75.394.98巴拉圭70.091.29格鲁吉亚72.899.010南非62.980.6待判样品11中国68.579.312罗马尼亚69.996.913希腊77.693.814哥伦比亚69.390.3o分析分类判别o基本设定:判别分析的SPSS实现o相关选项刀切法的分类效果原始数据的分类效果o相关选项保存分类结果结果分析:方差分析o识字率在各组中差别很不显著,对分类的作用可能不大。判别分析的SPSS实现oFisher判别函数 D=-16.661+0.342预期寿命-0.09识字率判别分析的SPSS实现o两类的重心 根据待判样品的数据计算Fisher判别函数的值,离哪个组的重心近就归入哪一类。判别分析的SPSS实现分类函数D1=-190+5.44预期寿命-0.362识字率D2=-162+4.88预期寿命-0.214识字率u实际是Bayes判别分析的结果。u把待判样品的数据代入分类函数,哪个组的值最大就分入那个组。有几个组就有几个分类函数。判别分析的SPSS实现分类效果的评价这里SPSS中使用的是Bayes判别的分类结果分类正确分类错误待判样品的分类结果判别分析的SPSS实现谢谢 谢!谢!放映结束 感谢各位观看!让我们共同进步