《spss因子分析聚类分析.doc》由会员分享,可在线阅读,更多相关《spss因子分析聚类分析.doc(19页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、吉林财经大学2019-2019学年第一学期多元统计分析期末论文一二三四五总分学院:工商管理学院专业:人力资源管理年级:2009级学号:姓名: 西甲球员的综合能力统计分析摘要:足球运动是一项古老的体育活动,是目前全球体育界最具影响力的单项体育运动。球员是足球运动中不可缺少的部分,球技是影响球员乃至球队发展的重要因素。本文通过网上搜集西甲联赛部分球员的技术数据统计为依据,运用spss软件对不同球员的球技进行因子分析和聚类分析。关键词:足球、球员、球技、因子分析、聚类分析引言:足球是世界最受欢迎的一项运动,故有世界第一大运动的美称!当今足球运动已成为人们生活中不可缺少的组成部分,不论在任何地区,足球
2、都成为了一项不可或缺的运动。当今世界各地都有足球联赛,各地也都有不同形式的球队及比赛,据不完全统计,现在世界上经常参加比赛的球队约80万支,登记注册的运动员约4000万人,其中职业运动员约10万人。当然,球员的水平也不尽相同,每个人心中都有各自所喜爱的球队及球员。当今世界两大豪门为巴塞罗那和皇家马德里,他们深受世界大多数人们的喜爱,所以本文选择了最受人们欢迎的西甲球员进行数据统计分析。一、 指标选取进行球员技术的数据统计分析,必须选取合适的指标,做到全面准确地反映每一个球员的技术,对不同的球员加以区分,综合的反映一个球员的技术水平,因此从出场、出场时间、进球、助攻、射门等方面选取了能够反映个人
3、球技水平的10项指标,分别为:X1出场(次)X2出场时间(分)X3进球(个)X4助攻(个)X5射门(次)X6射正(次)X7犯规(次)X8越位(次)X9黄牌(张)X10角球(个)原始数据的收集与整理:球员出场出场时间进球助攻射门射正犯规越位黄牌角球梅西21592217344c罗2017432384阿德里亚诺1274413846108比利亚1912198254251222219伊瓜因2195314罗西1218518卡卡81111洛伦特18717012哈维191487652493108厄齐尔269212莱昂4253101133121尼尔马103赫迪拉113蒂亚戈126210013318131皮克11
4、马塞洛16146索尔达多22169816161272718521本泽马28161908佩德罗1691115苏亚雷斯161250008125070内格雷多1284251311514236卡纳莱斯16法尔考193418012法布雷加斯16138伊涅斯塔1272914238102111阿尔维斯1199佩佩1640普约尔1174810539020拉莫斯28240阿隆索2117761415426071卡列洪106华金86313迪亚拉052凯塔19979006125112二、因子分析因子分析是一种数据简化的技术,它是将具有相关性的多个 原始变量通过空间线性变换为较少的几个抽象的综合指标的一种方法。得到新的
5、综合指标称为公因子,这些主成分不仅保留了原始指标的绝大多数信息,并且彼此不相关。利用因子得分计算 出每个评价对象的综合得分,并以此作为综合评价的依据。因子分析的主要目的是用来描述隐藏在一组测量到的变量中的一些更基本的,但又无法直接测量到的隐性变量本文采用因子分析方法,将10个变量抽象为少数几个抽象的因子,那么前提是指标体系中的10个指标有一定的相关性。由指标相关系数矩阵可以得出指标间存在很强的相关性,故因子分析是可行的,也是有意义的。(一)SPSS软件运行结果及分析1、描述性统计量表 表2-1上面的表格显示了出场、出场时间、进球、助攻等10个指标的描述性统计量,如均值、标准化方差等,这为以后进
6、行因子分析提供了一个直观地分析结果。从上表中可以看出,出场时间、射门、射正和犯规所占的比重是最大的,出场、进球、助攻、越位、黄牌和角球所占的比重较低。2、因子分析共同度 表2-2该表显示了所有变量的共同度数据。第一列是因子分析初始解下的变量共同度,均为1(原始变量标准化后的方差为1)。事实上,因子个数小于原有变量的个数才是因子分析的目的。所以,第二列列出了按指定提取条件提取特征值的共同度。可以看到,所有变量的绝大部分信息可被因子解释,因此本次因子提取的总体效果是比较理想的。3、因子分析的总方差解释 表2-3该表显示的是因子分析的总方差解释,是相关系数矩阵的特征值、方差贡献率及累计方差贡献率的计
7、算结果。可以看到,第一个因子的特征值是5.178,解释了原有10个变量总方差的51.776%;前三个因子的累计方差贡献率为81.642%,并且只有它们的特征值大于1,说明前三个公因子基本包含了全部变量的主要信息,因此选取前三个因子为主因子即可。同时,“Extraction Sums of Squared Loadings”和“Rotation Sums of Squared Loadings ”这两列分别列出了因子提取后和旋转后的因子方差解释情况。从表中可以看到,它们都选择三个公因子。我们把这三个公因子分别表示为F1、F2和F3。4、旋转前的因子载荷矩阵 表2-4该表显示了旋转前的因子载荷矩阵
8、,它是因子分析的核心内容。通过载荷系数大小可以分析不同公共因子所反映的主要指标的区别。从结果看,大部分因子解释性较好,但是仍有少部分指标解释能力较差,如黄牌在三个因子的载荷系数区别不大。因此,接着采用因子旋转的方法使得因子载荷系数向0或1两极分化,使大的载荷更大,小的载荷更小,这样结果更加具有可解释性。5、旋转后的因子载荷矩阵 表2-5由旋转后的因子载荷矩阵可以看出,第一公因子F1在射正、射门、角球、越位、进球、上的载荷都很大,其中射门、射正、进球是反映个人能力的指标,角球是反映球员的战略战术的指标,越位在一定程度上反映了球员的意识及反应能力。因此, F1为反映个人技术能力及球场意识的公共因子
9、,可以将其命名为个人技术能力及球场意识因子。第二公因子F2在犯规、出场时间及出场次数上载荷较大,在此因子上的得分反映了球员的受重视程度,可以命名为受重视程度因子。第三公因子F3仅在助攻上有较大的载荷,助攻反映了球员的球场意识,可以命名为球员意识水平因子。6、因子得分系数矩阵 表2-6根据表中的内容,可以写出以下因子得分函数:F1=0.038X1-0.011X2+0.163X3-0.083X4+0.220X5+0.232X6-0.045X7+0.221X8-0.157X9+0.223X10F2=0.285X1+0.361X2-0.043X3+0.033X4-0.043X5-0.067X6+0.3
10、88X7-0.059X8+0.359X9-0.103X10F3=0.014X1+0.156X2+0.272X3+0.805X4-0.050X5-0.054X6-0.190X7-0.179X8+0.107X9-0.062X10最后,计算出因子得分,以各因子的方差贡献率占三个因子总方差贡献率的比重作为权重进行加权汇总得出各城市的综合得分F,即F=(F1*51.776+F2*18.466+F3*11.4)/81.6427、各个球员在每个公因子上的得分及综合得分如下表所示:球员F1F2F3F梅西36.382660.1074281.607211.6996c罗33.87629.1802267.857201
11、.1914阿德里亚诺-3.391272.8942116.48875.83909比利亚14.376443.3188182.984134.9388伊瓜因11.667349.7894143.514106.5547罗西14.854369.443150.243113.9608卡卡2.146263.0016112.18676.51233洛伦特6.011555.6254223.098160.6369哈维-5.834540.777234.964151.4235厄齐尔-3.898483.8834203.695135.4167莱昂0.64393.47638.48726.92452尼尔马-1.572216.8829
12、0.39560.68022赫迪拉-5.61337.957141.49292.63932蒂亚戈-3.656234.7492.89263.74641皮克-6.733244.1984101.72465.1676马塞洛-10.513515.0488217.699140.2261索尔达多11.028623.2074256.726183.8001本泽马12.744459.1212194.727139.1178佩德罗6.811332.3328136.51298.54904苏亚雷斯-13.374467.612190.769123.922内格雷多2.905310.6354128.25690.01153卡纳莱斯-
13、1.582214.85988.8259.99638法尔考11.889587.7174238.211173.7336法布雷加斯-0.041400.773172.671114.7326伊涅斯塔1.472268.1426112.96977.35702阿尔维斯-11.824361.977190.816101.0187佩佩-13.056515.088213.98138.1029普约尔-6.57276.914115.20674.55322拉莫斯-16.564654.4802268.999175.0888阿隆索-16.725658.7966275.623176.888卡列洪4.596132.42255.18
14、340.57168华金-2.335388.693162.297109.097迪亚拉-10.047359.2694142.394.75877凯塔-9.11368.303147.6998.14887 表2-7(二)综合分析及评价1、根据各个球员在三个公因子上的得分对其综合发展水平进行评价(1)在个人能力因子F1上得分最高的前五个城市依次是梅西、C罗、罗西、比利亚和法尔考,得分分别为36.382、33.87、14.854、14.376和11.889。得分在10分以上的有8人,说明这些球员的个人能力以及足球技术都是比较优秀的,而梅西和C罗的成绩却达到了30以上,远远高于其他球员的得分。这说明此二人的球
15、技在整个西甲球队中都是非常突出的,他们代表的不仅仅是自己,也代表了他们的球队。部分球员的个人能力还是比较好的,但是容易造成越位,这成为影响他们个人能力因子的重要因素,这样就导致他们在F1这个因子中比分不是太高,比如卡卡、佩德罗、卡列洪等。另外,此因素也受到出场次数以及出场时间等因素的限制。总体来说,就球员的个人技术能力而言,梅西和C罗无疑是技术水平最好的球员,其技术水平是其他球员所无法超越的。哈维和伊涅斯塔也是比较不错的球员,虽然技术水平也比较好,但是由于受到位置的限制,射门机会较少,致使此项数据在F1中的得分偏低。拉莫斯、阿隆索等部分球员射门次数较少,技术水平相对其他球员较弱,所以在F1中的
16、得分最低。(2)在球员受重视程度因子F2上得分较高的是梅西、阿隆索、拉莫斯、C罗、索尔达多,在F2中的得分分别为660.1074、658.7966、654.4802、629.1802和623.2074。此项得分在400分以上的有15人,说明这些球员的受重视程度对于教练和球队来说是较好的,在球队里是主力人员,发挥着不可替代的作用,同时这也表明了他们是球队里非常受信任的球员,出场时间较多以及出场次数较多,同时也避免不了有较多的犯规。得分最低的为卡列洪和莱昂,分别为132.422、93.476,这说明,他们的个人能力和没有完全的到教练的认可同时也没有完全得到其他队员的信任,因此这类球员应针对自己本身
17、存在的问题进行改善,及早的融入到整个队伍之中。(3)在球员意识水平因子F3上得分最高的是梅西和C罗,他们的得分均在200分以上,分别为211.6996和201.1914。另外,索尔达多、阿隆索、拉莫斯、法尔考等人的得分也相对较高,均达到170分以上,说明这些人在球场上的意识水平较高,能充分有效地捉住每一个可以利用的时机,同时也可以为他人创造机会。在此项因子中得分最低的为卡列洪和莱昂,得分分别为40.57和26.92分,这说明他们在球场上的判断能力较差,不能有效的抓住机会,球场意识水平较低。2、结合各个球员的综合得分对其综合水平进行评价根据综合得分F来综合评价各位球员的综合水平。综合得分排名前六
18、位的球员依次是梅西、C罗、索尔达多、阿隆索、拉莫斯和法尔考,他们的综合得分均在170分以上,梅西和C罗的得分已达到200分以上;综合得分最低的六个球员依次是蒂亚戈、匹克、尼尔马、卡纳莱斯、卡列洪和莱昂。他们的得分均在70分一下。通过此项分析可知,这些球员的综合水平还是存在着较大的差距,综合能力较低的球员有待于进一步提高他们自己在各方面的能力,继续保持自己的优势,加强训练水平较低的其他指标。三、 聚类分析为了更加清晰地反映上述34位球员的综合能力水平,在个人技术水平上存在的差异,将对这些球员进行进一步聚类分析。聚类分析(Cluster Analysis)是定量研究分类问题的一种多元统计分析方法。
19、其基本思想是同一类中的个体有较大的相似性,不同类中的个体差异较大,于是根据一批样品的多个观测指标,找出能够度量样品(或变量)之间相似程度的统计量,并以此为依据,采用某种聚类的方法,将所有的样品(或变量)分别聚合到不同的类中。(一)spss数据结果及分析聚类凝聚过程表 表3-1样本归类表表3-2 聚类树形图* * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * Dendrogram using Ward Method Rescaled Distance Cluster Combine C A S
20、E 0 5 10 15 20 25 Label Num +-+-+-+-+-+ Case 12 12 Case 22 22 Case 3 3 Case 31 31 Case 7 7 Case 25 25 Case 14 14 Case 28 28 Case 15 15 Case 11 11 Case 13 13 Case 16 16 Case 34 34 Case 21 21 Case 32 32 Case 24 24 Case 10 10 Case 19 19 Case 9 9 Case 26 26 Case 29 29 Case 30 30 Case 20 20 Case 33 33 Ca
21、se 27 27 Case 1 1 Case 2 2 Case 8 8 Case 23 23 Case 17 17 Case 5 5 Case 18 18 Case 4 4 Case 6 6 图3-1表3-1是聚类的凝聚过程表,整体上反映了队球员进行聚类的全过程。从此表显示,聚类共进行了33步。另外,Coefficients值随着聚类的进行逐渐增大,开始增加的慢,后面增加得快,表明聚类开始时类间的差异小,结束时类间的差距大,这正是分层聚类方法所表现出来的特征。表3-2是样品的归类表,本例采用Ward最小方差法,把球员最终分为四类,表中分别给出了各个球员所属的类别。图3-1清晰地反映了聚类的全过
22、程,他将实际的距离按比例调整到0.25范围以内,用逐级连接的方式连接性质相近的样品和新类,直到并为一类。可以在此图上用一把尺子垂直方向放在图上左右移动,与尺子相交的每一根横线就是一类。每根横线左端与之联系的各样品就是分到该类的成员。本例聚为四类:第一类:梅西、C罗,此类为球员技术水平较好的球员第二类:阿德里亚诺 卡卡、哈维、厄齐尔、莱昂、尼尔马、赫迪拉、蒂亚戈、皮克、马塞洛、佩德罗、内格雷多、卡纳莱斯、法布雷加斯、伊涅斯塔、阿尔维斯、普约尔、卡列洪、华金、凯塔,此类球员为技术水平中等偏上的球员。第三类:比利亚、伊瓜因、罗西、洛伦特、索尔达多、本泽马,此类球员为技术水平中等偏下的球员。第四类:苏
23、亚雷斯、佩佩、拉莫斯、阿隆索、迪亚拉,此类球员为技术水平较差的球员。(二)综合分析通过聚类分析的方法,将以上球员最终分为四类,梅西、C罗分为第一类,在上述因子分析中,F1、F2、F3三项因子的得分也都稳居第一位,并且得分全部都高出其他球员较多。经过上述分析以及数据表现说明此二人的个人能力较强,各项数据都较平均、稳定,不论个人技术水平还是球场上的意识水平都是很好的,受重视程度也是较高的。对此二人在进行比较,梅西的各项数据都要高出C罗一点点,说明梅西的个人综合能力还是要更胜一筹。其他球员大多数都集中在第二类上,说明多数球员的技术水平还是处于中等偏上的位置,个人的综合能力大体上较好,第三类和第四类球
24、员的综合能力不是太好,其中部分球员的个人能力还是不错的,但是受到其他方面原因的限制,在其他方面的数据偏低,可能导致他们最终的综合能力水平数据偏低。四、对于加强球员综合能力水平的建议通过以上因子分析和聚类分析队球员的各项数据、因子进行分析得出以上结论,针对这些结论所反映的问题提出以下建议。加强个人的技术水平,平时多进行足球训练,在训练的同时不断提高自己的技术水平。抓住每一次上场的机会,在球场上尽量减少失误,注重团队合作水平,加强团队合作意识,因为足球比赛是团队的比赛,而不是个人的比赛,纵使个人技术再好没有合作个人的综合能力水平也不会较高。也只有这样才能减少失误,抓住机会进球,才能赢得球员、教练以及广大球迷们的认可。球队高层管理者在引进球员的时候,能胜任多个位置(即多功能型球员)要优先考虑,因为此类人能力较强,能够起到带头指导作用,能够带动其他球员的共同进步。另外,教练 要多给予球员们鼓励,让他们感觉到自己的重要性,这样有利于激发他们的斗志,让他们首先自身先承认自己的价值,这样对他们的进步及综合素质的提高是非常有必要的。第 19 页