《2022年多元统计分析——判别分析实验报告 .pdf》由会员分享,可在线阅读,更多相关《2022年多元统计分析——判别分析实验报告 .pdf(11页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、学 生 实 验 报 告学院:课程名称:多元统计分析专业班级:姓名:学号:名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 11 页 - - - - - - - - - 学生实验报告学生姓名学号同组人实验项目判别分析必修选修演示性实验验证性实验操作性实验综合性实验实验地点实验仪器台号指导教师实验日期及节次一、实验目的及要求:1、目的熟悉 SPSS 统计软件,学会在统计软件 SPSS 中进行判别分析, 并通过判别分析输出结果图,再进行判别分析。 根据输出结果,把未分组的判给距离
2、相近那组。2、内容及要求 熟悉 spss 软件有关判别分析的操作; 利用 spss 软件分析判别分析课后练习第六题,判定待判组的类别归属; 输出并解释分析结果并完成实验报告。二、仪器用具:仪器名称规格/ 型号数量备注计算机1 有网络环境SPSS 软件1 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 11 页 - - - - - - - - - 三、实验方法与步骤 : 步骤一: 将数据复制到 SPSS 中,经过编辑后形成某地区人口死亡状况的数据集,如图 1 所示。图 1
3、某地区人口死亡状况的观测数据名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 11 页 - - - - - - - - - 步骤二: 根据要求,采用系统聚类方法,在SPSS 中选择分析 - 分类-判别分析如图 2。图 2 判别分析步骤三:进行判别分析, 将 X1到 X6全部选入自变量中, 分组变量为组别, 如图 3。图 3 判别分析选项框步骤四: 在统计量选项框中选择均值,单变量,Box s M 等,如图 4;分类选项中勾选个案、摘要等,如图5。名师资料总结 - - -精品
4、资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 11 页 - - - - - - - - - 图 4 统计量选项框图 5 分类选项框名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页,共 11 页 - - - - - - - - - 四、实验结果与数据处理:1检验各组的描述统计量和对各组均值是否相等:表 1 Analysis Case Processing SummaryUnweigh
5、ted Cases N Percent Valid 15 78.9 Excluded Missing or out-of-range group codes 4 21.1 At least one missing discriminating variable 0 .0 Both missing or out-of-range group codes and at least one missing discriminating variable 0 .0 Total 4 21.1 Total 19 100.0 表 1 反映的是有效样本量为15,变量的缺失值为4。表 2 Tests of Eq
6、uality of Group MeansWilks Lambda F df1 df2 Sig. X1 .997 .019 2 12 .981 X2 .990 .061 2 12 .941 X3 .645 3.301 2 12 .072 X4 .438 7.690 2 12 .007 X5 .174 28.557 2 12 .000 X6 .926 .478 2 12 .631 表 2 是对各组均值是否相等的检验,根据P 值,我们可以在0.01 的显著性水平上拒绝 X4与 X5在三组的均值相等的假设,即认为变量X4、X5在三组的均值是有显著差异的。2. 典型判别函数:表 3 Eigenvalu
7、esFunction Eigenvalue % of Variance Cumulative % Canonical Correlation dimension01 59.330a98.8 98.8 .992 2 .693a1.2 100.0 .640 a. First 2 canonical discriminant functions were used in the analysis. 表 4 Wilks LambdaTest of Function(s) Wilks Lambda Chi-square df Sig. dimension01 through 2 .010 43.948
8、12 .000 2 .591 4.999 5 .416 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 6 页,共 11 页 - - - - - - - - - 由表3可以得出:第一判别函数解释了98.8%的方差,第二判别函数解释了1.2%的方差,两个判别函数解释了全部的方差。表4是对两个判别函数的显著性检验,由Wilkins Lambda检验,在 0.05 的显著性水平上,根据 P值可以得到,第一个判别函数是显著的,第二个判别函数是不显著的。3. 判别函数、判别载荷和各组的重心:表
9、5 Standardized Canonical Discriminant Function CoefficientsFunction 1 2 X1 -17.046 -7.677 X2 14.757 9.870 X3 -1.306 -.513 X4 6.381 -.666 X5 1.332 .710 X6 4.315 1.833 表6 Structure MatrixFunction 1 2 X1 .007*-.002 X5 .280 -.394*X4 .145 -.201*X3 .096 .104*X2 .007 .103*X6 -.035 .092*表7 Canonical Discrim
10、inant Function CoefficientsFunction 1 2 X1 -1.950 -.878 X2 1.748 1.169 X3 -.930 -.365 X4 .825 -.086 X5 .102 .054 X6 1.662 .706 (Constant) -78.896 -30.330 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 7 页,共 11 页 - - - - - - - - - 表8 Functions at Group Centroids组别Func
11、tion 1 2 1 -2.647 1.013 2 9.444 -.259 3 -6.797 -.754 表5是标准化的判别函数,表示为:Y1=-17.046X1+14.757X2-1.306X3+6.381X4+1.332X5+4.315X6 Y2=-7.677X1+9.870X2-0.531X3-0.666X4+0.710X5+1.833X6 表6为结构矩阵,即判别载荷,表四是反映判别函数在各组的重心表7是非标准化的判别函数,表示为:Y1=-78.896-1.950X1+1.748X2-0.930X3+0.825X4+0.102X5+1.662X6 Y2=-30.330-0.878X1+1
12、.169X2-0.365X3-0.086X4+0.054X5+0.706X6 4分类的统计结果 :表8 Classification Function Coefficients组别1 2 3 X1 -159.015 -181.479 -149.370 X2 168.068 187.715 158.749 X3 -98.413 -109.195 -93.908 X4 58.217 68.296 54.948 X5 11.702 12.862 11.185 X6 202.770 221.972 194.625 (Constant) -5628.382 -6584.377 -5266.780 Fis
13、hers linear discriminant functions 表8是每组的分类函数,也称费歇线性判别函数,三组的分类函数表示为:Y1=-5628.382-159.015X1+168.068X2-98.413X3+58.217X4+11.702X5+202.770X6 Y2=-6584.377-181.479X1+187.715X2-109.195X3-68.296X4+12.862X5+221.972X6 Y3=-5266.780-149.370X1+158.749X2-93.908X3+54.948X4+11.185X5+194.625X6 可以根据计算每个观测在各组的分类函数值,将
14、观测分类到较大的分类函数值中。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 8 页,共 11 页 - - - - - - - - - 表9 Classification Resultsb,c 组别Predicted Group Membership Total 1 2 3 Original Count 1 5 0 0 5 2 0 5 0 5 3 0 0 5 5 Ungrouped cases 1 1 2 4 % 1 100.0 .0 .0 100.0 2 .0 100.0 .0 1
15、00.0 3 .0 .0 100.0 100.0 Ungrouped cases 25.0 25.0 50.0 100.0 Cross-validatedaCount 1 5 0 0 5 2 1 4 0 5 3 2 0 3 5 % 1 100.0 .0 .0 100.0 2 20.0 80.0 .0 100.0 3 40.0 .0 60.0 100.0 表9为分类矩阵表,通过判别函数的预测,根据原数据的所属组关系,3组观测全部被判对,未分组的变量中有一个待判样品判给第一组,有一个待判样品判给第二组,有两个待判样品判给第三组。在交叉验证中,第一组5个样品全部被判对,第二组 5个样品观测中有 4个
16、被判对,第三组 5个样品观测中有 3个被判对。图 6 分类结果根据上图 6分类结果可以看出:第二组样品与第一组样品和第三组样品可以很清晰地区分开,而第一组与第三组样品存在重合区域,即存在误判。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 9 页,共 11 页 - - - - - - - - - Casewise StatisticsCase Number Actual Group Highest Group Second Highest Group Discriminant Sco
17、res Predicted Group P(Dd | G=g) P(G=g | D=d) Squared Mahalanobis Distance to Centroid Group P(G=g | D=d) Squared Mahalanobis Distance to Centroid Function 1 Function 2 p df O R I G I N A l 1 1 1 .846 2 1.000 .334 3 .000 25.690 -2.197 1.375 2 1 1 .876 2 1.000 .266 3 .000 24.876 -2.292 1.386 3 1 1 .94
18、2 2 1.000 .119 3 .000 20.463 -2.782 1.330 4 1 1 .756 2 .999 .561 3 .001 14.211 -3.289 .628 5 1 1 .800 2 1.000 .445 3 .000 18.184 -2.677 .346 6 2 2 .789 2 1.000 .474 1 .000 159.052 9.939 .219 7 2 2 .659 2 1.000 .835 1 .000 128.948 8.594 -.594 8 2 2 .050 2 1.000 5.990 1 .000 181.077 10.332 -2.540 9 2
19、2 .091 2 1.000 4.786 1 .000 127.694 8.627 1.771 10 2 2 .955 2 1.000 .092 1 .000 154.498 9.728 -.151 11 3 3 .936 2 1.000 .132 1 .000 20.106 -6.901 -.406 12 3 3 .836 2 1.000 .359 1 .000 25.430 -7.393 -.693 13 3 3 .076 2 1.000 5.152 1 .000 45.937 -8.834 -1.756 14 3 3 .178 2 .905 3.457 1 .095 7.964 -4.9
20、42 -.630 15 3 3 .607 2 .997 .998 1 .003 12.361 -5.914 -.286 16 ungrouped 3 .000 2 1.000 395.903 1 .000 587.379 -21.903 -13.704 17 ungrouped 1 .745 2 .999 .588 3 .001 14.106 -3.393 .834 18 ungrouped 2 .000 2 1.000 31.237 1 .000 295.309 14.502 2.120 19 ungrouped 3 .310 2 1.000 2.344 1 .000 35.657 -7.9
21、14 -1.801 C R O S S - v a l i d a t e d a1 1 1 .966 6 1.000 1.398 3 .000 25.267 2 1 1 .939 6 1.000 1.776 3 .000 24.694 3 1 1 .982 6 1.000 1.097 3 .000 19.351 4 1 1 .933 6 .998 1.853 3 .002 14.084 5 1 1 .278 6 .998 7.485 3 .002 20.003 6 2 2 .000 6 1.000 44.990 1 .000 218.235 7 2 1*.000 6 1.000 126.77
22、8 2 .000 162.921 8 2 2 .000 6 1.000 50.095 1 .000 366.046 9 2 2 .000 6 1.000 50.786 1 .000 130.354 10 2 2 .000 6 1.000 240.321 1 .000 420.033 11 3 3 .898 6 1.000 2.224 1 .000 19.683 12 3 3 .387 6 1.000 6.328 1 .000 29.808 13 3 3 .000 6 1.000 31.587 1 .000 133.553 14 3 1*.088 6 1.000 11.010 3 .000 45
23、.428 15 3 1*.011 6 .959 16.478 3 .041 22.802 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 10 页,共 11 页 - - - - - - - - - 根据上表 Casewise Statistics结果可以得出:将待判样品1(第16行)判给第三组,将待判样品 2(第17行)判给第一组,将待判样品3(第18行)判给第二组,将待判样品 4(第18行)判给第三组 。五、讨论与结论名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 11 页,共 11 页 - - - - - - - - -