《NBA球队实力的聚类分析.docx》由会员分享,可在线阅读,更多相关《NBA球队实力的聚类分析.docx(11页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、论文题目NBA球队实力的聚类分析得分评分人摘要:本文主要通过在网上寻找数据(NBA30支球队2014-2015年赛30场季常规 赛数据),首先用描述性统计对已有数据进行简单分析,之后运用SPSS软件对NBA30 支球队的实力进行了聚类分析,根据2015-2016赛季30场常规赛的数据将它们分为4 类。关键词:SPSS; NBA球队数据;聚类分析;第一章引言1.1 研究背景NBA是世界上最顶级的篮球联赛,美国四大职业体育联赛之一。NBA是社交媒体上 最受欢迎的体育联盟,联盟、球队以及球员的社交媒体平台拥有超过6亿的关注人群 和粉丝。NBA共有30支球队,东西部各15支,每支球队都要经历82场常规
2、赛,之后 东西部各前8名球队还要进行季后赛的比拼,直到决出冠军。本赛季每支球队都已经 打了 30场常规赛,球队战绩与上赛季相比也有较大变化。1.2 研究目的本文通过对30支球队的前30场常规赛数据进行分析,对球队实力进行分类,对 于球迷了解球队实力、预测后期52场常规赛比赛结果和季后赛席位有很好的参考价 值。1.3 研究方法聚类分析川是多元统计分析中研究样本或指标的一种主要的分类方法,其基本思 想是把所有待分类事物各自看成独立的一类,求出两两之间的亲疏指标值,把关系最 为亲密的两类合并成一个新类,然后计算新类与原有各类之间的亲疏指标值,再把其 中关系最为密切的两类合并一一如此反复进行,直到最终
3、所有待分类事物合并成一个 大类为止。样品数据之间的亲疏程度主要通过样品之间的距离、样品间的相关系数来 表示O根据不同的距离定义方法可以测算出定义在P维空间上样本之间的距离,并根 据此距离来度量样本之间的相似程度。聚类分析直接比拟各事物之间的性质,将性质相近的归为一类,将性质差异较大太阳45. 80%36. 90%42.3218.315. 122.4105.7103.72湖人43. 60%35. 70%42.620.57.612.321.8102. 3109.2-6. 9鹑鹏45. 70%33. 40%42.921.77.612.219.6101.6102-0.4奇才47. 20%39%43.4
4、25. 1814.222100.596.63.9凯尔特人46%32. 40%43.525.58.415.221103. 3104.4-1. 1马刺46. 70%38.20%44.224.47.51519.7102.898.93.9国王46. 10%34. 30%44.7206.216.322.6102.6103.9-1.3火箭42. 80%34. 50%44.8209. 117. 323. 3100.997.33.6活塞41.90%34. 10%44.820.57.313. 62095.5100.7-5.2勇士47. 90%37%45.225.78.91620. 1107.498.78.7步行
5、者43. 10%33. 40%45.320.75. 714.321.294.798.5-3.8公牛45. 80%36. 50%45.5225. 714. 719. 1103.598.74.8掘金43%31.70%4620.76.814.924101.5104.3-2.8雷霆44. 40%32. 40%46.319.66.715.322.99896. 11.9开拓者45. 40%37. 80%46.623. 16.814. 119.710496.5的归入不同的类。判别分析那么先根据类别的事物的性质,利用某种技术建立函数 式,然后对未知类别的新事物进行判断以将之归入类别中。第二章数据收集本文采取的
6、数据来源于新浪官网的NBA球队数据库。选取30支球队的一些数据统 计作为聚类分析的依据。这些统计包括投篮命中率、三分球命中率、总篮板数、助攻 数、抢断数、失误数、犯规数、得分和失分以及净胜分十项指标,具体数据见附录1。第三章描述性统计分析3.1 对投篮命中率的分析一个球队的投篮命中率是球队强弱的直观表达,虽然有一句话叫防守赢得比赛, 但是投篮命中就可以得分,强大的得分能力还可以弥补球队的其它弱项。所以命中率 也能在一定程度上决定比赛的胜负,我们选取各队的命中率在EXCEL中做图分析,结 果见图一。投篮命中率XI平均命中率图一 30支球队的投篮命中率从图中不难看出,投篮命中率最高的是勇士队,命中
7、率接近48. 00%,接着小牛紧 随其后,也比勇士队差不了多少。明显看出快船、小牛、奇才、勇士这四支球队的命 中率远超联盟平均命中率。而反观76人队命中率排在30支球队倒数,在41. 00%左右, 明显比倒数第二的活塞队低了不少,并且在联盟平均水平之下。3.2 球队失误数分析得分表达一个球队的进攻水平,而失误数也能反映一个球队的进攻配合,间接反 映球队的进攻水平,失误不仅是在给对手机会,更会使我方队伍军心涣散,从而影响 比赛的走势。所以,减少失误才能使进攻流畅,为赢下比赛奠定基础。因此我也对各 球队的失误数做了分析,在EXCEL中作出失误雷达图来分析。结果见图二。掘金雷夸。热妮克斯雄鹿黄蜂湖人
8、太阳灰熊小牛图二球队失误雷达图从雷达图中可以看出76人球队、雄鹿队、国王队、勇士队、火箭队的失误数都在 15个以上,而76人队、火箭队、雄鹿队显得尤为突出,并且76人队最高,都快接近 20个了。而在控制失误上,快船队、猛龙队、黄蜂队三个球队无疑做得很好。第四章聚类分析进入 SPSS分析程序,选择 Analyzef Classifyf Hierarchical Cluster,进行 系统聚类分析(Hierarchical Cluster Analysis),采取对个案进行聚类,即Q型聚 类分析。聚类方法使用Ward s Method,距离测量技术选择Euclidean distance (欧 氏
9、距离),得出以下计算结果。图三为分层聚类分析的聚类过程表。表中第一列表示聚类分析的步骤。第二列和 第三列表示该步聚类分析中,哪两个样本聚成了一类;如:第一步显示第8和9两个 样本聚成了一类,第七步显示样本16和样本18和第3步聚类形成的新类进行了聚类, 依次类推,聚类过程共进行了 29步,所有的样本聚成了一大类。第四列表示两个样本阶 7234567891011121314151617181920212223242526272829间的距离,从表中可以看出,距离小的样本之间先聚类;第五和第六列表示某步聚类 分析中,参与聚类的是样本还是类,0那么表示样本,数字n (非零)表示第n步聚类产生 的类参
10、与了本步聚类;第七列表示本步聚类结果在下面聚类的第几步中用至上群集组合首次出现阶群集群集1群集2系数群集1群集2下一阶892.064001224252.805002018193. 60700713223. 7510010563.882001527303.90500916184. 2370317244. 617001227295.075601713175. 626401412266. 5910021286. 600811915216. 785002313286. 95410020578. 084501910148. 584002316278. 610792211208. 79600262510.
11、 058121525132410. 34714222122311.62911024131611.704201724101511.979161325121314. 64921222721016. 71119232621120. 17125182721222. 4542624282323. 659270291244. 7540280图三群组成员聚类过程图爵士 篮网 魔术 尼克斯 步行者 活塞 黄蜂 掘金 国王 雷霆 火箭 森林狼 湖人 雄鹿 太阳 凯尔特人 骑士 灰熊 辅鹏 快船 小牛 猛龙 公牛 开拓者 奇才 马刺 老鹰 勇士 热火76人使用平均联接(组间)的树状图四球队类型关联图得到的使用Wa
12、rd联结的树状图如图4,该图较好地反映了各球队类型之间的关 联。上面的树状图清晰地表示了聚类的全过程。用逐级连线的方式连接性质相近的个 案和新类,直至并为一类。经过SPSS软件处理,我们选择的分类范围最小为3类,最大为5类,分组结果如图五所示。由聚类分析Ward联结树状图以及群集成员分类表可以看出,我们可以将NBA球队按 实力分为4类比拟合理,具体见图六。类别球队第一类76人第二类魔术、尼克斯、步彳诸、活塞、黄蜂、 爵士、篮网、雷霆、森林狼、火箭、 掘金、湖人、国王第三类热火第四类雄鹿、奇才、鹏雄、老鹰、骑士、灰 熊、马刺、凯尔特人、公牛、开拓者、 太阳、快船、勇士、猛龙、小牛图六球队聚类图第
13、一类里面只有76人一个队,这是因为76人队的投篮命中率、三分命中率、场 均得分、净胜分都是联盟最低,助攻数也很低,而且失误数为全联盟最高。这与目前 76人联盟垫底的排名相符,76人也是唯一彻底摆烂的球队。第二类中的球队投篮命中率较低而失误较多,场均净胜分也均为负值。这些球队 中除了火箭之外,其余球队的排名在联盟中都比拟靠后,这一类球队是联盟中实力较 弱的球队。火箭战绩高居西部第四,但是却被归为实力较弱的一类,这主要是由于火 箭的场均失误较多,为联盟第二;场均犯规也很多;且投篮命中率较低,仅仅强于76 人和活塞。而火箭战绩出色的原因主要是火箭的进攻节奏很快,进攻回合数多,且火 箭是联盟罚球次数最
14、多的球队,所以得分能力并不差。第三类球队只有热火一支球队,这是因为热火的场均篮板是联盟最少,且比倒数 第二的尼克斯队少了足足4个篮板,助攻数也不多,进攻乏力让热火得分仅仅高于76 人和魔术队。但是热火的排名位于联盟中游,在东部排到第七,这是因为热火队在抢 不到篮板的情况下依然将对手得分控制在97. 7分,这是很难做到的,这是靠每个人的 积极防守做到的。热火这赛季遭遇了伤病困扰,相信如果没有伤病,在如此防守质量 下,球队的成绩定能更进一步。第四类球队包含了除火箭外联盟中排名靠前的队伍。这些球队篮板、助攻、场均 净胜分都排在联盟前列。排名相对靠后的凯尔特人队也进入了这一类,这是因为该队 的各项统计
15、均到达了该类的平均水平,助攻/失误比控制的也不错。球队战绩不理想的 原因主要是失分太高,这可能是由于队员防守不积极造成的,而这在数据统计中并不 能直观反映。第五章结论运用SPSS软件、,采用描述性统计分析和聚类分析两种方法对我30支球队进行分 析并分类,分类结果如下:第一类:76人队,投篮命中率、三分命中率、场均得分、净胜分都是联盟最低, 助攻数也很低,而且失误数为全联盟最高,与联盟垫底的排名相符。第二类:魔术、尼克斯、步行者、活塞、黄蜂、爵士、篮网、雷霆、森林狼、火 箭、掘金、湖人、国王。这些球队投篮命中率较低而失误较多,场均净胜分也均为负 值。这些球队中除了火箭之外,其余球队的排名在联盟中
16、都比拟靠后,这一类球队是联盟中实力较弱的球队。火箭虽然战绩较好,但是由于失误数多,犯规多,投篮命中 率低等原因也被归为这一类。第三类:热火队。这是因为热火的场均篮板是联盟最少,且比倒数第二的尼克斯 队少了足足4个篮板,助攻数也不多,进攻乏力让热火得分仅仅高于76人和魔术队。 但是热火的排名位于联盟中游,在东部排到第七,这是因为热火队在抢不到篮板的情 况下依然将对手得分控制在97. 7分,说明热火的防守是联盟顶级。第四类:雄鹿、奇才、何鹏、老鹰、骑士、灰熊、马刺、凯尔特人、公牛、开拓 者、太阳、快船、勇士、猛龙、小牛。这些球队在联盟中排名都比拟靠前,篮板、助 攻、场均净胜分都排在联盟前列。根据聚
17、类分析和判别分析的结果可知,以上分类结果大致反响了 NBA球队实力, 与实际情况基本吻合。总的来说,通过聚类分析和判别分析掌握NBA球队本赛季的实力差异,对球迷们 合理分析比赛结果、预测季后赛球队有参考意义。参考文献1周复恭,黄运成.应用线性回归分析M,中国人民大学出版社,1989.8.2韩於羹.应用数理统计M.北京:北京航空航天大学出版社,2002.3余建英,何旭宏.数据统计分析与SPSS应用M,人民邮电出版社,2003.4杜琳琳,时立文,薛晓光.SPSS统计分析从入门到精通(第二版).北京,清 华大学出版社,2012.6. 15孙海燕,周梦,李卫国,冯伟.应用数理统计M.北京:北京航空航天
18、大学 出版社,2010.附录:2014-2015赛季NBA球队常规赛数据统计球队名称投篮命中率X1三分命中率X2总篮板X3助攻X4抢断X5失误X6犯规X7得分X8失分X9净胜分X10热火46. 20%35. 60%35.919.88.714.420.694.597.7-3.2尼克斯44. 80%35. 30%39.421.27. 114.822.794.6101.4-6. 8雄鹿46. 40%36. 40%40.422.79172399.3100. 1-0.8快船47. 20%38.30%40.624.47. 712.621. 1106. 3101.15.2老鹰46. 70%37. 30%40
19、.725.78.514.718. 7101.997.34.6骑士46. 20%34. 70%40.822.77. 113.718. 1102.299.42.8魔术45. 60%37. 70%4119.86. 614.920.893.999-5. 1森林狼43. 50%33. 20%41.322.49. 115.320.798.5109-10.546. 40%36. 80%41.421.17.411.622108.5100. 18.4爵士45. 60%33%41.620. 16.214.818.896. 1100.2-4. 176人41.20%29. 60%41.819.910. 118.92290.8102.6-11.8篮网44. 70%33. 50%41.820.8714.720.396.599. 1-2. 6黄蜂43%32. 40%4220.55.511.218.695.7100.2-4. 5小牛47. 70%35. 20%42. 123. 3812.420. 3109.5103.26. 3灰熊46. 30%35.50%42.222.78. 112.219.8102. 397.64.7