《2022年多元统计分析模拟考题及答案 .pdf》由会员分享,可在线阅读,更多相关《2022年多元统计分析模拟考题及答案 .pdf(7页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、- 1 - 一、判断题( 对)112(,)pXXXX的协差阵一定是对称的半正定阵( 对)2 标准化随机向量的协差阵与原变量的相关系数阵相同。(对)3典型相关分析是识别并量化两组变量间的关系,将两组变量的相关关系的研究转化为一组变量的线性组合与另一组变量的线性组合间的相关关系的研究。(对) 4 多维标度法是以空间分布的形式在低维空间中再现研究对象间关系的数据分析方法。(错)5),(),(21ppNXXXX,,X S分别是样本均值和样本离差阵,则,SXn分别是,的无偏估计。(对) 6),(),(21ppNXXXX,X作为样本均值的估计,是无偏的、有效的、一致的。(错)7 因子载荷经正交旋转后,各变
2、量的共性方差和各因子的贡献都发生了变化(对)8 因子载荷阵()ijAa中的ija 表示第 i 个变量在第 j 个公因子上的相对重要性。(对) 9判别分析中, 若两个总体的协差阵相等,则 Fisher 判别与距离判别等价。(对) 10 距离判别法要求两总体分布的协差阵相等,Fisher 判别法对总体的分布无特定的要求。二、填空题1、多元统计中常用的统计量有:样本均值向量、样本协差阵、样本离差阵、样本相关系数矩阵2、设是总体1(,)mXXX的协方差阵,的特征根(1,)iim与相应的单位 正 交 化 特 征 向 量12(,)iiiimaaa, 则 第 一 主 成 分 的 表 达 式 是1111122
3、1mmya Xa XaX,方差为1。3 设是总体1234(,)XXXXX的协方差阵,的特征根和标准正交特征向量分别为:112.920(0.1485, 0.5735, 0.5577, 0.5814)U221.024(0.9544, 0.0984,0.2695,0.0824)U330.049(0.2516,0.7733, 0.5589, 0.1624)U440.007( 0.0612,0.2519,0.5513, 0.7930)U,则其第二个主成分的表达式是名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - -
4、 - - - 第 1 页,共 7 页 - - - - - - - - - - 2 - 212340.95440.09840.26950.0824yXXXX,方差为 1.024 4.若),()(pNX, (n,2 ,1)且相互独立,则样本均值向量X服从的分布是(,)pNn5.设( ,),1,2,16ipXNi,X和A分别是正态总体的样本均值和样本离差阵,则21154()4()TXAX服从215(15,)( ,)16pTpF p npp或6 设3( ,),1,2,10iXNi,则101()()iiiWXX服从3(10, )W7.设随机向量123(,)XXXX,且协差阵4434923216,则其相关
5、矩阵R=2313821136311868.设122(,)( ,),XXXN, 其 中212(,),11,则1212,)XXXXCov(0 9 设 X,Y 是来自均值向量为,协差阵为的总体G的两个样品,则X,Y间的马氏平方距离2(,)dX Y1()()XYXY10 设 X,Y 是来自均值向量为,协差阵为的总体 G的两个样品,则X与总体 G的马氏平方距离2(,)dX G=1()()XX11 设随机向量123(,)XXXX的相关系数矩阵通过因子分析分解为121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1
6、032013R名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 7 页 - - - - - - - - - - 3 - 则1X的共性方差21h0.9342 =0.872 ,其统计意义是:描述了全部公因子对变量X1的总方差所作的贡献,称为变量 X1 的共同度, 反映了公共因子对变量X1 的影响程度。标准化变量X1 的方差为 1,公因子f1 对 X 的贡献21g0.9342+0.4172+0.8352=1.743 12.对应分析是将Q 型因子分析和 R 型因子分析结合起来进行的
7、统计分析方法13 典型相关分析是研究两组变量间相关关系的一种多元统计方法14. 聚类分析中, Q 型聚类是指对样本进行聚类, R 型聚类是指对指标进行聚类。15 Spss for windows中 主 成 分 分 析 由Data Reduction-Factor Analysis 过程实现。16设,kkUV是第 k 对典型变量则()1,()1(1,2, )kkD UD Vkr(,)0,(,)0()ijijCov UUCov V Vij0(,1,2, )(,)0()0()iijij irCov UVijjr17. 在多维标度分析中,当D 是欧几里得距离阵时,X 是 D 的一个构图三、简答题(答案
8、见平时习题)1 简述多元统计的主要内容与方法(10分)可对比一元统计列出多元统计的主要内容与方法(从随机变量及其分布、 数字特征、四大分布(正态分布密度 (1 分) 、)(2n与威沙特分布),(nWp(1 分) 、t 分布与 Hoteling2T分布( 1 分) 、F 分布与威尔克斯分布),(21nnp(1 分) ) 、抽样分布定理、 参数估计和假设检验、统计方法( 2 分)2.请阐述距离判别法、贝叶斯判别法和费希尔判别法的基本思想和方法,比较其异同3 请阐述系统聚类法、K均值聚类法、有序样品聚类法的基本思想和方法,比较其异同4 请阐述主成分分析和因子分析的基本思想、方法步骤和应用,比较其异同
9、5 请阐述相应分析、 多维标度法、 典型相关分析和多变量的可视化分析的基本思想和应用四、计算题1设三维随机向量33( ,2)XNI,已知321000.510.510,010,0.500.520001IAd, 求YA Xd的分布名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 7 页 - - - - - - - - - - 4 - 解:正态分布的线性组合仍为正态,故只需求112( )()1210.50.512131()10101110.50.5E YE AXdAEXdDYD
10、AXdADXA所以3( ),( )YNE YD Y另解:123131231312313123130.50.510.50.52(0.50.51)2( 0.50.52)1(0.50.51)3( 0.50.52)1(0.50.51, 0.50.52)1XXXYAXdXXEXXXEXXDXXXDXXCOVXXXXX故3( ( ),( )YNE YD Y2. 设 三 维 随 机 向 量3(,)XN, 已 知21113,1321122, 求12332YXXX 的分布解:正态分布的任意线性组合仍正态,故Y的分布是一维正态分布,只需求12322123121332( )3 ()2 ()()13( )3()2()
11、()2(3,2)2(3,)2(,2)9E YE XE XE XD YE XE XE XCovXXCovXXCov XX故(13,9)YN3设 有 两 个 二 元 总 体和, 从 中 分 别 抽 取 样 本 计 算 得 到,假设, 试用距离判别法建立判别函数和判别规则。样品 X=(6,0) 应属于哪个总体?解:=,=,=名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 7 页 - - - - - - - - - - 5 - 即样品 X属于总体4设已知有两个正态总体12,G G
12、, 且12122411,6219,而其先验概率分别为120.5,qq误判的代价4L(2 |1), (1|2)eLe,试用贝叶斯判别法确定样本35X属于哪个总体?解:由 Bayes 判别知,11122( )( )exp()()( )fxW xxfx其中1211224311()624229121,1148321(1| 2)(2 |1)q Cdeq C123( )5xW xWWdx故35X属于 G2总体5表 1 是根据某超市对不同品牌同类产品按畅销(1) 、平销( 2)和滞销( 3)的数据,利用 SPSS得到的 Bayes 判别函数系数表,请据此建立贝叶斯判别函数,并说明如何判断新样品( x1,x2
13、,x3 )属于哪类?Classification Function Coefficientsgroup 1 2 3 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页,共 7 页 - - - - - - - - - - 6 - x1 -11.689 -10.707 -2.194 x2 12.297 13.361 4.960 x3 16.761 17.086 6.447 (Constant) -81.843 -94.536 -17.449 Fishers linear discri
14、minant functions 表1 Bayes判别函数系数解:根据判别分析的结果建立Bayes 判别函数:Bayes 判别函数的系数见表4.1 。表中每一列表示样本判入相应类的Bayes 判别函数系数。由此可建立判别函数如下:Group1:3761.162297.121689.11843.811XXXYGroup2:3086.172361.131707.10536.942XXXYGroup3:3447.62960.41194.2449.173XXXY将新样品的自变量值代入上述三个Bayes 判别函数,得到三个函数值。比较这三个函数值,哪个函数值比较大就可以判断该样品判入哪一类。6.对某数据
15、资料进行因子分析,因子分析是从相关系数阵出发进行的,前两个特征根和对应的标准正交特征向量为112.920(0.1485, 0.5735, 0.5577, 0.5814)U,112.920(0.1485, 0.5735, 0.5577, 0.5814)U(1) 取公因子个数为2,求因子载荷阵(2) 用 F1F2表示选取的公因子,12,为特殊因子, 写出因子模型, 说明因子载荷阵中元素ija的统计意义7 在一项对杨树的形状研究中,测定了20 株杨树树叶,每个叶片测定了四个变量1234,XXXX分别代表叶长,叶子2/3 处宽, 1/3 处宽, 1/2 处宽,这四个变量的相关系数矩阵的特征根和标准正交
16、特征向量分别为:112.920(0.1485, 0.5735, 0.5577, 0.5814)U221.024(0.9544, 0.0984,0.2695,0.0824)U名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 6 页,共 7 页 - - - - - - - - - - 7 - 330.049(0.2516,0.7733, 0.5589, 0.1624)U440.007( 0.0612,0.2519,0.5513, 0.7930)U若按一般性原则选取主成分个数,请写出主成分表
17、达式,并计算每个主成分的方差贡献率解:选取主成分的一般原则是特征值大于1 或累积贡献率达到80% 以上。据题选取两个主成分,其表达式和贡献率分别是:1123410.14850.57350.55770.5814,2.920yXXXX贡献率为2123420.95440.09840.26950.0824,1.024yXXXX贡献率为8 下表是进行因子分析的结果,试根据表中信息写出每个原始变量的因子表达式,并分析是否需要对因子载荷旋转。Component Matrix Component 1 2 3 X1 .969 -1.084E-02 .205 X2 .911 .321 -.102 X3 .847
18、-.120 .323 X4 .941 .281 -2.693E-02 X5 .899 .215 -1.963E-02 X6 -.313 .839 .305 X7 -.666 6.280E-02 .679 X8 .575 -.580 .367 Extraction Method: Principal Component Analysis.a 3 components extracted. 解:由表F1 F2 F3 X1 .969 -1.084E-02 .205 X2 .911 .321 -.102 X3 .847 -.120 .323 X4 .941 .281 -2.693E-02 X5 .89
19、9 .215 -1.963E-02 X6 -.313 .839 .305 X7 -.666 6.280E-02 .679 X8 .575 -.580 .367 知X1= .969F1 -1.084E-02F2+ .205 F3 可以不做因子旋转,因为载荷系数基本处于两极分化状态,第一个公因子在指标X1 ,X2,X3,X4,X5,X7,X8有较大载荷, F2 只在 X6 和 X8 上有较大载荷,F3 只在 X7 上有较大载荷。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 7 页,共 7 页 - - - - - - - - -