《2022年实用多元统计分析相关习题.docx》由会员分享,可在线阅读,更多相关《2022年实用多元统计分析相关习题.docx(14页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选学习资料 - - - - - - - - - 练习题一、填空题1人们通过各种实践,发觉变量之间的相互关系可以分成(相关) 和(不相关) 两种 类型; 多元统计中常用的统计量有:样本均值、样本方差、样本协方差和样本相关系数;2总离差平方和可以分解为(回来离差平方和) 和(剩余离差平方和) 两个部分,其中(回来离差平方和) 在总离差平方和中所占比重越大,就线性回来成效越显著;3回来方程显著性检验时通常采纳的统计量是(SR/p)/SE/(n-p-1);4偏相关系数是指多元回来分析中, (当其他变量固定时,给定的两个变量之间的)相关系数;的5Spss 中回来方程的建模方法有(性回来 )等;一元线性
2、回来、多元线性回来、岭回来、多对多线6主成分分析是通过适当的变量替换,使新变量成为原变量的 (线性组合),并寻求(降维) 的一种方法;7主成分分析的基本思想是 (设法将原先众多具有肯定相关性(比如 P 个指标),重新组合成一组新的相互无关的综合指标来替代原先的指标);8主成分表达式的系数向量是(相关系数矩阵) 的特点向量;9样本主成分的总方差等于(1);10在经济指标综合评判中, 应用主成分分析法, 就评判函数中的权数为 (方差奉献度 );主成分的协方差矩阵为 (对称) 矩阵;主成分表达式的系数向量是(相关矩阵特点值)的特点向量;11SPSS中主成分分析采纳 (analyzedata redu
3、ctionfacyor)命令过程;12因子分析是把每个原始变量分解为两部分因素,一部分是 为(特别因子);(公共因子),另一部分13变量共同度是指因子载荷矩阵中(第 i 行元素的平方和 );(亲疏程14公共因子方差与特别因子方差之和为(1);15聚类分析是建立一种分类方法,它将一批样品或变量依据它们在性质上的 度)进行科学的分类;16Q 型聚类法是按 (样品) 进行聚类, R 型聚类法是按 (变量) 进行聚类;17Q 型聚类统计量是 (距离),而 R 型聚类统计量通常采纳 (相关系数);18六种 Q 型聚类方法分别为 (最长距离法)、(最短距离法)、(中间距离法)、(类平 均法)、(重心法)、
4、(离差平方和法);19快速聚类在 SPSS中由 (k-均值聚类 (analyzeclassifyk means cluster)过程实 现;20判别分析是要解决在讨论对象已 已知类别中哪一类的多元统计方法;(已分成如干类 )的情形下,确定新的观测数据属于21用判别分析方法处理问题时,通常以 接近程度的指标;(判别函数 )作为衡量新样本点与各已知组别22进行判别分析时,通常指定一种判别规章,用来判定新样本的归属,常见的判别准就有 (Fisher 准就 )、(贝叶斯准就 );23类内样本点接近,类间样本点疏远的性质,可以通过(类与类之间的距离) 与(类内样本的距离) 的大小差异表现出来,而两者的比
5、值能把不同的类区分开来;这个比值越大,说明类与类间的差异越(类与类之间的距离越大),分类成效越 (好 );24Fisher 判别法就是要找一个由p 个变量组成的 (线性判别函数 ),使得各自组内点的名师归纳总结 - - - - - - -第 1 页,共 8 页精选学习资料 - - - - - - - - - (离差) 尽可能接近,而不同组间点的尽可能疏远;二、简答题 1、简述复相关系数与偏相关系数;答:复相关系数 :又叫多重相关系数;复相关是指因变量与多个自变量之间的相关关系;例如,某种商品的需求量与其价格水平、职工收入水公平现象之间出现复相关关系;偏相关系数:又叫部分相关系数;部分相关系数反
6、映校正其它变量后某一变量与另一变量的相关关系;偏相关系数是指多元回来分析中,当其他变量固定后,给定的两个变量之间的的相关系数;偏相关系数的假设检验等同于偏回来系数的 分析;t 检验; 复相关系数的假设检验等同于回来方程的方差2、简述逐步回来分析方法的详细实施步骤;答: 逐步回来过程如下:1)自变量的剔除;2)重新进行少一个自变量的多元线性回来分析;3)重新进行多一个自变量的多元线性回来分析;4)重新进行上述步骤,直至无法再删除和再引入自变量为止;3、提取样本主成分的原就;答:主成分个数提取原就为主成分对应的特点值大于 被看成是表示主成分影响力度大小的指标,假如特点值小于1 的前 m 个主成分;
7、特点值在某种程度上可以 1,说明该主成分的说明力度仍不如直接引入一个原变量的平均说明力度大,因此,一般可以用特点值大于 1 作为纳入标准;4、简述系统聚类法的基本思想及主要步骤;答:系统聚类的基本思想是:距离相近的样品(或变量)先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品(或变量)总能聚到合适的类中;系统聚类过程是:假设总共有 n 个样品(或变量) ,第一步将每个样品(或变量)独自聚成一类,共有 n 类;其次步依据所确定的样品(或变量)“ 距离” 公式,把距离较近的两个样品(或变量)聚合为一类,其它的样品(或变量)仍各自聚为一类,共聚成 n 1 类;第三步将“ 距离” 最近的两个类
8、进一步聚成一类,共聚成 n 2 类; ,以上步骤始终进行下去,最终将全部的样品(或变量)全聚成一类,也简称集合法;仍有与以上方法相反的称分解法;5、简述快速聚类( k均值聚类)的基本思想及主要步骤;答:基本思想: 1.一个样品安排给最近中心(均值)的类中,将全部样品分成 k 个初始类; 2.通过欧式距离将每个样品划入离中心最近的类中,并对得到样品或失去样品的类重新运算中心坐标;3.重复步骤 2,直到全部样品都不能再安排时为止;6、判别分析的分类;答:判别分析是多元统计分析中用于判别样本所属类型的一种统计分析方法;判别分析按判别的组数来分,有两组判别分析和多组判别分析;按区分不同总体所用的数学模
9、型来分,有线性判别和非线性判别;按判别对所处理的变量方法不同,有逐步判别、序贯判别等;按判别准就不同,有距离判别、贝叶斯判别(Bayes)、费歇( Fisher)判别等;7、简述 Fisher 判别规章及详细判别步骤;答: Fisher 判别法的基本思想:从多个总体(类)抽取肯定的样本,借助方差分析的思想,建立 p个指标的线性判别函数,把待判样品代入线性判别函数,然后与临界值比较,就可判样品属于哪个类;Fisher 判别法的详细算法步骤:由Fisher 线性判别式*S1M1M2求解向量*的步骤:1 把来自两类2训练样本集X 分成1 和2 两个子集 X1 和 X2;1 名师归纳总结 - - -
10、- - - -第 2 页,共 8 页精选学习资料 - - - - - - - - - 由Mi1xkX X ik,I,12,运算M i;ni 由Six kXiXkMix kMT运算各类的类内离散度矩阵Si ,i=1,2 ;i 运算类内总离散度矩阵S*S 1S 2; 运算S的逆矩阵S1; 由*S1M1M2求解;三、运算题1.现收集了 92 组合金钢中的碳含量x 及强度 y,且求得:x0 . 1255,y45. 7989Lxx0.3019Lxy26.5126Lyy2941. 031求 y 关于 x 的一元线性回来方程;2求 y 与 x 的相关系数;3列出对方程作显著性检验的方差分析表;4在 x=0.
11、1 时,求 y.的点估量;2 名师归纳总结 - - - - - - -第 3 页,共 8 页精选学习资料 - - - - - - - - - 2. 某地区通过一个样本容量为 为722 的调查数据得到劳动力受训练年数的一个回来方程edu i 10.36 0.094 sibs i 0.131 medu i 0.210 fedu i R 20. 2 1 4式中, edu为劳动力受训练年数, sibs为劳动力家庭中兄弟姐妹的个数,medu与 fedu 分别为母亲与父亲受到训练的年数;问(1)如 medu 与 fedu 保持不变,为了使猜测的受训练水平削减一年, 需要 sibs增加多少?(2)请对 me
12、du的系数赐予适当的说明;(3)假如两个劳动力都没有兄弟姐妹,但其中一个的父母受训练的年数均为 12 年,另一个的父母受训练的年数均为16 年,就两人受训练的年数预期相差多少年3 名师归纳总结 - - - - - - -第 4 页,共 8 页精选学习资料 - - - - - - - - - 4 名师归纳总结 - - - - - - -第 5 页,共 8 页精选学习资料 - - - - - - - - - 3下表给出一二元模型的回来结果;方差来源平方和( SS)自由度( d.f.)来自回来 ESS 65965 来自残差 RSS 总离差 TSS 66042 14 求:(1)样本容量是多少? RSS
13、 是多少? ESS和 RSS 的自由度各是多少?(2)R 和 22 R ?(3)检验假设:说明变量总体上对Y 有无影响;你用什么假设检验?为什么?4在一项讨论中,测量了 376 只鸡的骨骼,并利用相关系数矩阵进行主成分分析,见下表:Y1 Y2 Y3 Y4 Y5 Y6 头长 x1 0.35 0.53 0.76 -0.05 -0.04 0.00 头宽 x2 0.33 0.70 -0.64 0.00 0.00 0.04 肱骨 x3 0.44 0.19 -0.05 0.53 0.19 0.59 尺骨 x4 0.44 0.25 -0.02 0.48 0.15 0.63 股骨 x5 0.43 0.28 -
14、0.06 0.51 0.67 0.48 胫骨 x6 0.44 0.22 -0.05 0.48 0.70 0.15 特点值 4.57 0.71 0.41 0.17 0.08 0.06 1 运算前三个主成分各自的奉献率和累积奉献率;2 对于 y4,y5,y6 的方差很小这一点,你怎样对实际情形作出推断;解:5 名师归纳总结 - - - - - - -第 6 页,共 8 页精选学习资料 - - - - - - - - - 5在一项对杨树的性状的讨论中,测定了20 株杨树树叶,每个叶片测定了四个变量:叶长 x1,2/3 处宽 x2,1/3 处宽x3,1/2 处宽 x4;这四个变量的相关系数矩阵的特点
15、根和标准正交特点向量分别为:12 .920U10. 1485,0. 5735,0.5577,0.581421 .024U20. 9544,0. 0984,0. 26950, .082430. 049U30.2516,0.7733,0.5589,0 .162440. 007U40. 0612,0. 2519,0. 5513,0 .7930写出四个主成分,运算它们的奉献率;解:各自的主成分为:Z1=0.1485X1-0.5735X2-0.5577X3-0.5814X4 Z2=0.9544X1-0.0984X2+0.2695X3+0.0824X4 Z3=0.2516X1+0.7733X2-0.558
16、9X3-0.1624X4 Z4=-0.0612X1+0.2519X2+0.5513X3-0.7930X4 就各自的奉献率为:W1=2.920/2.920+1.024+0.049+0.007=0.73 W2=1.024/2.920+1.024+0.049+0.007=0.256 W2=0.049/2.920+1.024+0.049+0.007=0.01225 W2=0.007/2.920+1.024+0.049+0.007=0.00175 6对纽约股票市场上的五种股票的周回升率 x1,x2,x3,x4,x5 进行了主成分分析,其中 x1,x2,x3 分别表示三个化学工业公司的股票回升率,x4,x
17、5 表示两个石油公司的股票回升 率,主成分分析是从相关系数矩阵动身进行的,前两个特点根和对应的标准正交特点向 量为:12 . 857U1.0464 , 0 . 457 , 0 . 470 , 0 . 421 , .0421 20 . 809U2.0240 0, . 509 , 0 . 260 ,0 . 526 ,0 . 582 1 运算这两个主成分的方差奉献率;解:各自的主成分为:Z1=0.464X1+0.457X2+0.470X3+0.421X4+0.421X5 Z2=0.240X1+0.509X2+0.260X3-0.526X4-0.582X5 就各自的奉献率为:W1=2.587/2.58
18、7+0.809=0.762 W2=0.809/2.587+0.809=0.238 2 能否对这两个主成分的意义作一个合理的说明,并给两个主成分命名;答:说明:由 SPSS抽取的两个主成分, 其特点值分别为 2.857 和 0.809,;依据主成分分析得知:各自的奉献率为 回升率)影响较大;W1=76.2%,W2=23.8%;由此可知,第一个主成分对变量(股票命名:一、化学工业公司股票回升率二 、石油公司股票回升率7、下面给出了八个样品的两个指标数据指标样1 2 3 4 5 6 7 8 6 名师归纳总结 - - - - - - -第 7 页,共 8 页精选学习资料 - - - - - - - -
19、 - X1 2 4 0 1 3 5 2 3 X2 4 7 13 12 9 11 14 16 使用按动态聚类法进行聚类,采纳欧氏距离 解:四、上机操作取 1、3、7 号样本为聚点 ;会进行回来、聚类、因子、主成分、判别分析基本操作,上级题目随机抽取;请指出下面 SPSS软件操作分别代表多元统计分析中什么分析:(1)AnalysisRegressionLinear regression 回来分析聚类分析(2)AnalysisClassifyHierachical Cluster 系统聚类分析(3)AnalysisClassifyKmean Cluster K- 均值聚类分析(4)AnalysisData ReductionFactor 因子分析(5)AnalysisData ReductionFaactor 主成分分析(6)AnalysisClassifyDiscriminant 判别分析7 名师归纳总结 - - - - - - -第 8 页,共 8 页