《2022年多元统计教学案例 .pdf》由会员分享,可在线阅读,更多相关《2022年多元统计教学案例 .pdf(33页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、多元统计分析实验教学案例统计学院统计学系2005 年 11月名师资料总结-精品资料欢迎下载-名师精心整理-第 1 页,共 33 页 -1目录一、主成分分析案例-我国各地区普通高等教育发展水平综合评价二、因子分析案例-城市第三产业发展水平综合评价三、聚类分析案例-我国各地区普通高等教育发展状况分析四、多元回归分析案例-中国制度变迁和经济增长的实证分析五、综合案例-沪深股市动态风险结构特征分析名师资料总结-精品资料欢迎下载-名师精心整理-第 2 页,共 33 页 -2一、主成分分析案例-我国各地区普通高等教育发展水平综合评价(一)案例教学目的主成分分析试图在力保数据信息丢失最少的原则下,对多变量的
2、截面数据表进行最佳综合简化,也就是说,对高维变量空间进行降维处理。本案例运用 主成分分析 方法综合评价我国各地区普通高等教育的发展水平。通过本案例的教学,力图使学生加 深对主成分分析的 统计思想 和实际意义的理解,明确主成分分析 方法的适用环境,掌握主成分分析 软件实现操作方法,提高学生思考、分析和 解决实际问题 的能力。(二)案例研究背景近年来,我国普通高等教育 得到了迅速 发展,为国家培养了大批人才。但由于我国各地区经济发展水平 不均衡,加之高等院校原有布局使 各地区各地区高等教育发展的 起点不一致,因而各地区普通高等教育的发展水平存在一定的差异。对我国各地区普通高等教育的发展水平进行综合
3、评价,明确各地区的 差异,有利于管理和决策部门从宏观上把握 各地区普通高等教育的发展现状,更好的指导和规划高教事业的健康发展。(三)案例研究过程1、建立 综合评价 指标体系高等教育是 依赖高等院校进行的,高等教育的发展状况主要体现在高等 院校的相关方面。遵循选取 评价指标的目的性和可比性 原则,从高等教育的 五个方面选取十项 评价指标,具体如 下:名师资料总结-精品资料欢迎下载-名师精心整理-第 3 页,共 33 页 -32、数据资料指标的原始数据取自中国统计年 鉴,1995和中国教育 统计年 鉴,1995除以各地区 相应的人口数得到十项指标值见 表 1-1。其中:1x 为每百万人口高等院校数
4、;2x 为每十万 人口高等院校毕业生数;3x 为每十万 人口高等院校招生数;4x 为每十万 人口高等院校在校生数;5x 为每十万 人口高等院校教职工 数;6x 为每十万 人口高等院校专职 教师数;7x 为高级职称占专职 教师的比例;8x 为平均每所高等 院校的在 校生数;9x 为国家财政预算内 普通高教经 费占国内生产总值的比重;10 x 为生均 教育经 费。表 1-1 我国各地区普通高等教育发展状况数据地区1x2x3x4x5x6x7x8x9x10 x北京上海天津陕西辽宁吉林黑龙江湖北江苏广东四川山东甘肃湖南浙江新疆福建山西河北安徽云南江西海南内蒙古西藏河南广西5.96 3.39 2.35 1
5、.35 1.50 1.67 1.17 1.05.95.69.56.57.71.74.86 1.29 1.04.85.81.59.66.77.70.84 1.69.55.60 310 234 157 81 88 86 63 67 64 39 40 58 42 42 42 47 53 53 43 35 36 43 33 43 26 32 28 461 308 229 111 128 120 93 92 94 71 57 64 62 61 71 73 71 65 66 47 40 63 51 48 45 46 43 1557 1035 713 364 421 370 296 297 287 205
6、177 181 190 194 204 265 218 218 188 146 130 194 165 171 137 130 129 931 498 295 150 144 153 117 115 102 61 61 57 66 61 66 114 63 76 61 46 44 67 47 65 75 44 39 319 161 109 58 58 58 44 43 39 24 23 22 26 24 26 46 26 30 23 20 19 23 18 29 33 17 17 44.36 35.02 38.40 30.45 34.30 33.53 35.22 32.89 31.54 34.
7、50 32.62 32.95 28.13 33.06 29.94 25.93 29.01 25.63 29.82 32.83 28.55 28.81 27.34 27.65 12.10 28.41 31.93 2615 3052 3031 2699 2808 2215 2528 2835 3008 2988 3149 3202 2657 2618 2363 2060 2099 2555 2313 2488 1974 2515 2344 2032 810 2341 2146 2.20.90.86 1.22.54.76.58.66.39.37.55.28.73.47.25.37.29.43.31.
8、33.48.34.28.32 1.00.30.24 13631 12665 9385 7881 7733 7480 8570 7262 7786 11355 7693 6805 7282 6477 7704 5719 7106 5580 5704 5628 9106 4085 7928 5581 14199 5714 5139 名师资料总结-精品资料欢迎下载-名师精心整理-第 4 页,共 33 页 -4宁夏贵州青海1.39.64 1.48 48 23 38 62 32 46 208 93 151 77 37 63 34 16 30 22.70 28.12 17.87 1500 1469 102
9、4.42.34.38 5377 5415 7368 3、主成分分析定性考察反映 高等教育发展状况的 五个方面十项评价指标,可以看出,某些指标之间可能存在较强的相关性。比如每十万 人口高等院校毕业生数、每十万 人口高等院校招生数与每十万 人口高等院校在校生数之间可能存在较强的相关性,每十万 人口高等 院校教职工数和 每十万 人口高等院校 专职 教师数之间可能存在较强的相关性。为了验证这种想法,计算十个 指标之间的相关系 数,的相关矩阵如下:X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X1 1.000.943.953.959.975.980.407.066.868.661 X2.
10、943 1.000.995.995.974.970.614.350.804.600 X3.953.995 1.000.999.983.981.626.344.823.617 X4.959.995.999 1.000.988.986.610.326.828.612 X5.975.974.983.988 1.000.999.560.241.859.617 X6.980.970.981.986.999 1.000.550.222.869.616 X7.407.614.626.610.560.550 1.000.779.366.151 X8.066.350.344.326.241.222.779 1.
11、000.112.048 X9.868.804.823.828.859.869.366.112 1.000.683 X10.661.600.617.612.617.616.151.048.683 1.000 可以看出某些 指标之间确实存在很强的相关性,如果直接 用这些指标进行综合评价,必然造 成信息的 重叠,影响评价结 果的客观性。主成分分析 方法可以把多个指标转化为少数几个不相关的综合 指标,因此,可以考虑利用主成分进行综合评价。利用 SAS8.0 软件对十个评价指标进行主成分分析,相关矩阵的前几个特征根及其贡献率 如下:序号特征根贡献率累计贡献率 1 7.50215857 5.9251713
12、2 0.7502 2 1.57698725 1.04077379 0.9079 3 0.53621346 0.32983445 0.9615 4 0.20637902 0.06137774 0.9822 5 0.14500127 0.12281456 0.9967 6 0.02218671 0.01506645 0.9989可以看出,前两个特征根的累计贡献率 就达到 90%以上,主成分分析 效果很好。下面选取前四个主成分(累计贡献率 就达到 98%)进行综合评价。前四个特征根对应的特征 向量分别为:名师资料总结-精品资料欢迎下载-名师精心整理-第 5 页,共 33 页 -5Prin1 Prin
13、2 Prin3 Prin4 x1 0.349690 -.197248 -.163939 -.102208 x2 0.359021 0.034325 -.108403 -.226582 x3 0.362252 0.029115 -.090026 -.169164 x4 0.362251 0.013769 -.112789 -.160744 x5 0.360530 -.050673 -.153385 -.044208 x6 0.360156 -.064634 -.164455 -.003183 x7 0.224121 0.582629 -.039679 0.081178 x8 0.120071 0
14、.702075 0.357657 0.070228 x9 0.319240 -.194110 0.120384 0.899945 x10 0.245179 -.286509 0.863707 -.245705 由此可得四个主成分分 别为10211245.0359.0350.0 xxxZ+=L10212286.0034.0197.0 xxxZ-+-=L10213864.0108.0164.0 xxxZ+-=L10214246.0227.0102.0 xxxZ-+-=L从主成分的 系数可以看出,第一主成分主 要反映了前六个指标(学校数、学生数和教师数方面)的信息,第二主成分主 要反映了高校规模和教
15、师中高级职称 的比例,第三主成分主 要反映了生均 教育经 费,第四主成分主 要反映了国家财政预算内普通高教经 费占国内生产总值的比重。把各地区原 始十个 指标的标准化数据 代入四个主成分的表 达式,就可以得到各地区的 四个主成分 值。4、利用主成分进行综合评价分别以四个 主成分的 贡献率 为权重,构建主成分综合评价 模型:43210206.00536.01577.07502.0ZZZZF+=把各地区的 四个主成分值代入上式,可以得到各地区高教发展水平的综合评价值以及排序 结果。地区名次综合评价值北京1 9.098 上海2 4.619 天津3 2.665 陕西4 .844 辽宁6 .653 吉林
16、5 .726 黑龙江7 .201 湖北8 .070 江苏9 -.174 广东11 -.347 四川14 -.661 名师资料总结-精品资料欢迎下载-名师精心整理-第 6 页,共 33 页 -6山东18 -.797 甘肃13 -.586 湖南16 -.729 浙江17 -.746 新疆12 -.528 福建15 -.699 山西19 -.836 河北22 -.968 安徽27 -1.150 云南21 -.912 江西26 -1.129 海南25 -1.103 内蒙古24 -1.094 西藏10 -.191 河南28 -1.371 广西29 -1.416 宁夏20 -.890 贵州30 -1.51
17、0 青海23 -1.038(四)案例研究结果各地区高等教育发展水平 存在较大的差异,高教 资源的地区分 布很不均衡。北京、上海、天津等地区高等教育发展水平遥遥领先,主要表现在每百万 人口的学校数量和 每十万 人口的教师数量、学生数量以及国家财政预算内 普通高教经 费占国内生产总值 的比重 等方面。陕西和东北 三省地区高等教育发展水平也比较高。贵州、广西、河南、安徽等地区高等教育发展水平 比较落后,这些地区的高等教育发展 需要政策和资金的扶持。值得一提 的是西藏、新疆、甘肃等经济 不发达地区的高等教育发展水平 居于中上游水平,可能是由于人 口等原因。(五)案例进一步的讨论各地区高等教育发展水平
18、与各地区 人口增长率、经济发展水平等 因素有无关系,高等教育发展水平 受到哪些因素的制约?参考文献1 刘贤龙,我国普通高等教育发展水平的统计分析,数理 统计与管理,4,1998。2 胡永宏贺思辉,综合评价 方法,科学出版社,2000。名师资料总结-精品资料欢迎下载-名师精心整理-第 7 页,共 33 页 -7二、因子分析案例-城市第三产业发展水平综合评价(一)案例教学目的因子分析是 一种数据简化的 技术。它通过研究众 多变量 之间的 内部依赖关系,探求观测数据中的 基本结构,并用少数几个假想变量来表示其基本的数据结构。这几个假想变量能够反映原来众多变量的主 要信息。原始的变量是 可观测的显在变
19、量,而假想变量是 不可观测的潜在变量,称为因子。本案例运用因 子分析方法从 反映城市第三产业发展水平的20 个指标(变量)中抽出 5 个因子变量对 44 个城市的第三产业发展水平进行综合评价,分别计算出其因子得分和总得分,揭示出城市第三产业发展的发展状况。通过本案例的教学,力图使学生加 深对因子分析的 统计思想 和实际意义的理解,明确因 子分析方法的适用环境,掌握因 子分析软件实现操作方法,提高学生思考、分析和 解决实际问题 的能力。(二)案例研究背景近年来,我国城市化进 程不断发展,第三产业对经济增长的 贡献也不断增大。城市的第三产业发展状况是城市发展的一个重要 方面,也是整个国民经济第三产
20、业的一个重要 部分。对主要城市的第三产业发展状况进行比较和综合评价,可以了解城市第三产业发展状况,为制订相关的产业发展 政策,促进地区经济发展 提供依据。(三)案例研究过程1、建立 综合评价 指标体系城市第三产业发展表 现在多个方面,下面选取 20项评价指标,具体如 下:x1:人口数x2:GDP x3:第三产业增 加值x4:货运总量x5:批、零、商品销售 总额x6:外贸收购 总额x7:年末银行贷款余额x8:社会零售物 价指数x9:实际利用 外资x10:万名职工拥有科技人员数x11:旅游外汇收 入x12:第三产业的就业 比例x13:邮电业务总量x14:职工人均工资名师资料总结-精品资料欢迎下载-
21、名师精心整理-第 8 页,共 33 页 -8x15:人均居住面积x16:用水普及率x17:煤气普及率x18:人均道路面积x19:人均公用绿地面积x20:政策体制2、数据资料以上 20个指标的原始数据取自 城市统计年 鉴 1993-1994。3、因子分析将 20个原始指标表示为少数 m 个因子与特殊因子的线性组合,因子分析模型为+=+=+=202022,2011,2020222221212112121111mmmmmmFlFlFlXFlFlFlXFlFlFlXLMLL(1),(21mFFFFL=称为公共 因子,是 不可 观测向 量;),(2021L=称为特殊因子;()mijlL=20称为因子载荷
22、(矩阵),称为第 i 个变量在第 j 个因子上的载荷。下面用主成分分析 方法求出因子载荷(矩阵)。利用 20 个指标的原始数据可求得起相关矩阵的前几个特征根如下:特征值贡献率累计贡献率7.99 40 40 3.73 18.7 58.7 1.73 8.7 67.4 1.50 7.5 74.9 0.98 4.9 79.8 0.81 4.1 83.9 0.72 3.6 87.5 0.63 3.1 90.6 可以看出,取五个 因子,贡献率 可以达到近 80%。为了能 够更好的解释因子的实际含义,对因子进行极大方差 正交旋 转。旋转后的因子载荷(矩阵)为:0.49 -0.18 -0.22 0.24 0.
23、63 0.94 -0.02 -0.06 0.08 0.30 0.96 -0.02 0.01 0.00 0.23 0.51 -0.19 0.01 -0.12 0.67 0.94 -0.06 0.04 0.00 0.23 0.78 -0.00 0.28 0.16 0.04 0.94 -0.07 -0.01 -0.01 0.16 0.06 0.06 0.80 0.04 0.01 名师资料总结-精品资料欢迎下载-名师精心整理-第 9 页,共 33 页 -90.86 0.08 0.36 -0.03 0.07 0.10 0.01 -0.73 0.41 0.21 0.90 0.08 -0.03 -0.10
24、-0.16 0.26 0.03 -0.00 0.81 -0.026 0.96 0.04 0.08 -0.15 0.02 0.45 0.35 0.60 -0.26 -0.14 0.01 0.71 -0.10 -0.12 -0.40 0.25 -0.12 -0.09 0.75 -0.22 0.11 0.77 0.07 -0.06 0.27 0.18 0.68 0.20 -0.28 -0.23 0.22 0.42 0.69 0.24 0.15 从旋转后的因子载荷(矩阵)来看,五个因子的意义也比较明显,这五个因子分别是:(1)第三产业 基本经济 因子:x1:人口数x2:GDP x3:第三产业增 加值x
25、4:货运总量x5:批、零、商品销售 总额x6:外贸收购 总额x7:年末银行贷款余额x9:实际利用 外资x11:旅游外汇收 入x12:第三产业的就业 比例x13:邮电业务总量(2)基础环境因 子x15:人均居住面积x16:用水普及率x17:煤气普及率x18:人均道路面积x19:人均公用绿地面积(3)政策性因子x8:社会零售物 价指数x14:职工人均工资x20:政策体制(4)人员素质因子 x10:万名职工拥有科技人员数(5)补充因子4、综合评价估计出每个因子得分,分别反映 各城市在 五个方面的情况,再以因子的方差贡献率 为权重,将五个因子得分进行综合,可以得到各城市第三产业发展水平的综合评价 值。
26、部分城市的各 因子得分与综合评价 值如下:名师资料总结-精品资料欢迎下载-名师精心整理-第 10 页,共 33 页 -10城市基本经济 因子基础环境因 子政策性因子人员素质因子综合评价上海北 京广 州深圳天津福 州成都湛江北海济南贵阳兰州银川呼 和浩特西宁 5.007 -0.187 -0.002 -0.047 4.771 2.912 0.013 -0.109 0.24 3.056 2.496 0.043 -0.055 -0.140 2.344 1.272 0.845 -0.017 -0.025 2.075 0.994 -0.159 0.063 0.005 0.903 -0.258 0.093
27、0.004 -0.058 -0.219 0.048 -0.418 0.042 0.108 -0.220 -0.268 0.112 0.083 -0.189 -0.262 -0.821 0.511 0.195 -0.147 -0.265 -0.300 -0.189 0.095 0.109 -0.285-1.004 0.026 -0.241 -0.004 -1.225-0.852 -0.365 -0.076 0.042 -1.251-1.156 -0.221 -0.011 0.089 -1.299-1.051 -0.189 -0.197 -0.001 -1.438-1.19 -0.398 -0.1
28、04 0.007 -0.168(四)案例研究结果各城市第三产业发展水平 存在较大的差异,总体上,北京、上海、天津、广州、深圳等直辖市和南方大城市的第三产业发展水平 较高,而贵阳、兰州、银川、呼和浩特、西宁等西部和边远地区的城市第三产业发展水平较低。从各因子得分来看,北京、上海、天津、广州、深圳城市的基本经济 因子得分较高,贵阳、兰州、银川、呼和浩特、西宁等城市的 基本经济 因子得分较低;深圳、北海、湛江等城市的 基础环境因 子得分较高,西宁、兰州、成都等城市的基础环境因 子得分较低;北京、湛江、济南等城市的 政策性因子得分较高,贵阳、呼和浩特、北京等城市的 政策性因子得分较低;北京、济南、成都
29、等城市的 人员素质因子得分较高,湛江、北海、广州等城市的 人员素质因子得分较高低。(五)案例进一步的讨论1、因子分析与主成分分析的区 别是什么?2、因子分析用于综合评价 有何特色?参考文献1 胡永宏贺思辉,综合评价 方法,科学出版社,2000。2 张崇甫 等,统计分析方法及其应用,重庆大学出版社,1995。名师资料总结-精品资料欢迎下载-名师精心整理-第 11 页,共 33 页 -11三、聚类分析案例-我国各地区普通高等教育发展状况分析(一)案例教学目的聚类分析又称群分析,是对多 个样本(或指标)进行定量分类的一种多元统计分析方法。对样本进行分 类称为 Q 型聚类分析,对 指标进行分 类称为
30、R 型聚类分析。本案 例运用 Q 型和 R 型聚类分析方法对我国各地区普通高等教育的发展状况进行分析。通过本案例的教学,力图使学生加 深对聚类分析的 统计思想 和实际意义 的理解,明确聚类分析方法的适用场合,掌握聚类分析软件实现操作方法,提高学生思考、分析和 解决实际问题 的能力。(二)案例研究背景近年来,我国普通高等教育 得到了迅速 发展,为国家培养了大批人才。但由于我国各地区经济发展水平 不均衡,加之高等院校原有布局使 各地区各地区高等教育发展的 起点不一致,因而各地区普通高等教育的发展水平存在一定的差异,不同的地区 具有不同的特点。对我国各地区普通高等教育的发展状况进行聚类分析,明确各类
31、地区普通高等教育发展状况的差异与特点,有利于管 理和决策部门从宏观上把握 我国普通高等教育的 整体发展现状,分类制定相关政 策,更好的指导和规划我国高教 事业的整体健康发展。(三)案例研究过程1、建立 综合评价 指标体系高等教育是 依赖高等院校进行的,高等教育的发展状况主要体现在高等 院校的相关方面。遵循可比性 原则,从高等教育的 五个方面选取十项 评价指标,具体如下:名师资料总结-精品资料欢迎下载-名师精心整理-第 12 页,共 33 页 -122、数据资料指标的原始数据取自中国统计年 鉴,1995和中国教育 统计年 鉴,1995除以各地区 相应的人口数得到十项指标值见 表 1。其中:1x
32、为每百万 人口高等院校数;2x 为每十万 人口高等院校毕业生数;3x 为每十万 人口高等院校招生数;4x为每十万 人口高等院校 在校生数;5x 为每十万 人口高等院校教职工 数;6x 为每十万人口高等院校专职 教师数;7x 为高级职称占专职 教师的比例;8x 为平均每所高等院校的在校生数;9x 为国家财政预算内 普通高教经 费占国内生产总值的比重;10 x为生均 教育经 费。表 1 我国各地区普通高等教育发展状况数据地区1x2x3x4x5x6x7x8x9x10 x北京上海天津陕西辽宁吉林黑龙江湖北江苏广东四川山东甘肃湖南浙江新疆福建山西河北安徽云南江西海南内蒙古西藏河南广西5.96 3.39
33、2.35 1.35 1.50 1.67 1.17 1.05.95.69.56.57.71.74.86 1.29 1.04.85.81.59.66.77.70.84 1.69.55.60 310 234 157 81 88 86 63 67 64 39 40 58 42 42 42 47 53 53 43 35 36 43 33 43 26 32 28 461 308 229 111 128 120 93 92 94 71 57 64 62 61 71 73 71 65 66 47 40 63 51 48 45 46 43 1557 1035 713 364 421 370 296 297 28
34、7 205 177 181 190 194 204 265 218 218 188 146 130 194 165 171 137 130 129 931 498 295 150 144 153 117 115 102 61 61 57 66 61 66 114 63 76 61 46 44 67 47 65 75 44 39 319 161 109 58 58 58 44 43 39 24 23 22 26 24 26 46 26 30 23 20 19 23 18 29 33 17 17 44.36 35.02 38.40 30.45 34.30 33.53 35.22 32.89 31.
35、54 34.50 32.62 32.95 28.13 33.06 29.94 25.93 29.01 25.63 29.82 32.83 28.55 28.81 27.34 27.65 12.10 28.41 31.93 2615 3052 3031 2699 2808 2215 2528 2835 3008 2988 3149 3202 2657 2618 2363 2060 2099 2555 2313 2488 1974 2515 2344 2032 810 2341 2146 2.20.90.86 1.22.54.76.58.66.39.37.55.28.73.47.25.37.29.
36、43.31.33.48.34.28.32 1.00.30.24 13631 12665 9385 7881 7733 7480 8570 7262 7786 11355 7693 6805 7282 6477 7704 5719 7106 5580 5704 5628 9106 4085 7928 5581 14199 5714 5139 名师资料总结-精品资料欢迎下载-名师精心整理-第 13 页,共 33 页 -13宁夏贵州青海1.39.64 1.48 48 23 38 62 32 46 208 93 151 77 37 63 34 16 30 22.70 28.12 17.87 1500
37、1469 1024.42.34.38 5377 5415 7368 3、R型聚类分析定性考察反映 高等教育发展状况的 五个方面十项评价指标,可以看出,某些指标之间可能存在较强的相关性。比如每十万 人口高等院校毕业生数、每十万 人口高等院校招生数与每十万 人口高等院校在校生数之间可能存在较强的相关性,每十万 人口高等 院校教职工数和 每十万 人口高等院校 专职 教师数之间可能存在较强的相关性。为了验证这种 想法,运用 SPSS11.0 软件计 算十个 指标之间的Pearson相关系 数,相关矩阵如下:X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X1 1.000.943.953.
38、959.975.980.407.066.868.661 X2.943 1.000.995.995.974.970.614.350.804.600 X3.953.995 1.000.999.983.981.626.344.823.617 X4.959.995.999 1.000.988.986.610.326.828.612 X5.975.974.983.988 1.000.999.560.241.859.617 X6.980.970.981.986.999 1.000.550.222.869.616 X7.407.614.626.610.560.550 1.000.779.366.151 X8
39、.066.350.344.326.241.222.779 1.000.112.048 X9.868.804.823.828.859.869.366.112 1.000.683 X10.661.600.617.612.617.616.151.048.683 1.000 可以看出某些 指标之间确实存在很强的相关性,因此可以考虑从这些指标中选取几个有代表性的指标进行聚类分析。为此,首先把十个指标根据其相关性 进行 R型聚类,再从每个类中选取代表性的指标。首先对每个变量(指标)的数据分别进行标准化处理。变量间 相近性度量采用 Pearson 相关系 数,类间相近性度量的计算选用类平均法。聚类树型图见图
40、 2-1。图 1 指标聚类树型图图 1 最上面的横线是距离刻 度(SPSS将实际的相关系 数由大到 小反向转 换名师资料总结-精品资料欢迎下载-名师精心整理-第 14 页,共 33 页 -14为 0 到 25 之间的数 值),可以看出,每百万 人口高等院校数与每十万 人口高等院校毕业生数、每十万 人口高等院校招生数、每十万 人口高等院校在校生数、每十万人口高等院校教职工数、每十万 人口高等院校专职教师数 6 个指标之间有较大的相关性,最先被聚到一起。如果将 10 个指标分为 5 类,其它 4 个指标各自为一类。因此,可以考虑在最先被聚到一起的 6 个指标中选取 1-2 个指标,再与其它 4 个
41、指标共同构成基本分析 指标。如何在最先被聚到一起 的 6 个指标中选取1-2 个指标呢?考虑到高等院校是以学生为 中心,教职工的数量是 依据学生数量配备的,因此首先选定每十万 人口高等院校在校生数。再考虑到每百万 人口高等院校数是高等 院校数量方面(反映 高等教育发展状况的 五个方面之一)的唯一一个指标,因此可以保留下来。这样就从十个指标中选定了六个分析指标:1x每百万 人口高等院校数;4x每十万 人口高等院校在校生数;7x高级职称占专职 教师的比例;8x平均每所高等院校的在校生数;9x国家财政预算内 普通高教经 费占国内生产总值的比重;10 x生均教育经 费。可以根据这六个指标对 30个地区
42、进行 聚类分析。4、Q 型聚类分析根据这六个指标对 30 个地区进行 聚类分析。首先对每个变量的数据分 别进行标准化处理,样本间相近性采用欧氏距离 度量,类间距离的计算选用类平均法。聚类树型图见图 2。(四)案例研究结果各地区高等教育发展状况 存在较大的差异,高教资源的地区分 布很不均衡。如果根据各地区高等教育发展状况把 30个地区分 为三类,结果为:第一类:北京第二类:西藏第三类:其他地区如果根据各地区高等教育发展状况把 30个地区分 为四类,结果为:第一类:北京第二类:西藏第三类:上海 天津第四类:其他地区如果根据各地区高等教育发展状况把 30个地区分 为四类,结果为:第一类:北京第二类:
43、西藏第三类:上海 天津名师资料总结-精品资料欢迎下载-名师精心整理-第 15 页,共 33 页 -15第四类:宁夏贵州青海第五类:其他地区 C A S E 0 5 10 15 20 25 Label Num +-+-+-+-+-+河北 19?河南 26 广西 27 湖南 14 安徽 20 新疆 16 内蒙古 24 山西 18?江西 22 浙江 15 海南 23 福建 17 云南 21 辽宁 5?湖北 8 黑龙江 7 吉林 6 江苏 9?四川 11 山东 12?甘肃 13 广东 10?陕西 4 宁夏 28?贵州 29 青海 30?上海 2?天津 3 西藏 25 北京 1 图 2 各地区 聚类树型
44、图从以上结果结合聚类图中的合 并距离可以看出,北京的高等教育状况 与其他地区相比有非常大的不同,主要表现在每百万 人口的学校数量和每十万 人口的学生数量以及国家财政预算内 普通高教经 费占 国内生产总值 的比重 等方面远远高名师资料总结-精品资料欢迎下载-名师精心整理-第 16 页,共 33 页 -16于其他地区,这与北京作为全国的政治、经济 与文化中心的地位是吻合的。上海和天津作为另外两个较早的直辖市,高等教育状况和 北京是类似的状况。宁夏、贵州和青海的高等教育状况 极为类似,高等教育 资源相对匮乏。西藏作为一 个非常特殊的民族地区,其高等教育状况 具有和其他地区不同的情形,被单独 聚为一类
45、,主要表现在每百万 人口高等院校数比较高,国家财政预算内 普通高教经 费占国内生产总值的比重和生均教育经 费也相对较高,而高级职称占专职 教师的比例与平均每所高等院校的在校生数又都是全国最低的。这正是西藏高等教育状况的特殊之处:人口相对较少,经 费比较充足,高等 院校规 模较小,师资力量薄弱。其他地区的高等教育状况 较为类似,共同被聚为一类。针对这种情况,有关部门可以采取相应 措施对宁夏、贵州、青海和西藏 地区进行 扶持,促进当地高等教育事业的发展。(五)案例进一步的讨论1、如果用十个指标对各地区高等教育发展状况进行聚类,会有什么不同?2、可否用主成分对各地区高等教育发展状况进行聚类,会有什么
46、不同?参考文献1 刘贤龙,我国普通高等教育发展水平的统计分析,数理 统计与管理,4,1998。2 胡永宏贺思辉,综合评价 方法,科学出版社,2000。3 卢纹岱 主编,SPSS for Windows 统计分析,电子工业出版社,2000。名师资料总结-精品资料欢迎下载-名师精心整理-第 17 页,共 33 页 -17四、多元回归分析案例-中国制度变迁和经济增长的实证分析(一)案例教学目的多元线性回归刻画 多个自变量和 一个因变量之间的线性关系,是一种应用广泛的多变量 关系分析方法。本案例首先运用多元线性回归分析方法对我国制度变迁和经济增长的 关系进行实证分析,探索经济增长的 源泉;其次运用总量
47、 C-D生产函数(二元对数回归)估算了 1979-2004 年全要素生产率增长率;最后计算了全要素生产率增长对经济增长的 贡献。通过本案例的教学,力图使学生 感受到多元线性回归分析在实 际中应用的广泛性和灵活性,加深对多 元线性回归分析方法的理解,明确多元线性回归分析方法的适用情形以及实际中可能遇到的违背假设的问题,掌握多元线性回归分析软件实现操作方法,提高学生运用统计方法思考、分析和 解决实际问题 的能力与灵活性。(二)案例研究背景经济增长理 论是宏观经济学的重要组成部分,经济增长的 源泉一直是宏观经济学研究的核心问题。新古典增长理 论认为经济增长的 核心因素是物质资本、人力资本、劳动力和
48、技术。而制度-经济增长理 论认为物质资本、人力资本、劳动力和技术的增长本 身就是经济增长的 一部分,而不是引起经济增长的 根本原因。有效率的制度和经济 组织才是各 种生产要素投入增长 以及总体经济产 出增长的关键。因为有 效率的组织和制度 可以确立和界定人们的权利,以形成合理的 激励与约束机制,使经济主 体的的利益目标与与社 会目标接近,从而使 各种资源得到有效率的配置,使人们努力的进行 创新、资本积累、教育投入以促进规模经济的形成,最后表现为经济的增长。在转轨过程中,制度变迁和制度 建设对经济增长显得尤为重要。自 1978 年改革开放 以来,中国经济 已经经历了二十多年的高速增长。这种持续高
49、速增长的 一个核心因素就是改革开放 导致的中国制度变 革。然而,中国的制度变 革如何及在何种程度上引起经济增的增长?中国经济的 这种增长 能否持续下去?经济增长的 潜力何在?这些 都成为近年来 经济学研究的热门问题。对这些问题的研究是中国进 一步推进改革开放 和制定宏观经济政策的基础。(三)案例研究过程1、制度变迁和经济增长 关系分析(1)确定分析指标体系中国经济制度的变 革表现在多个方面,主 要有:配置资源的方式由过去的计划体制改为市场体制;进行经济主 体产权制度变 革,发展 壮大非公有制经济;实施对外开放,发展 外向型经济等等。这里选用以下几个指标反映制度变迁:名师资料总结-精品资料欢迎下
50、载-名师精心整理-第 18 页,共 33 页 -18(a)市场化程度(SCH),用投资的市场化指数表示,即全社会固定资产投资中“外资、自筹资金和其他投资”占总投资的比重。(b)非国有化水平(FGY),用非国有经济的增 加值占国内生产总值的比重表示,由于资料限制,这里用工业总产值中的比重表示。(c)开放程度(KFC),用对外贸易依存度表示即进出口总额与国内生产总值的比率。(d)工业化水平(GYH),用工业总产值占国内生产总值的比重表示。(e)非农化水平(FNH),用第二和第三产业就业 人数占总就业人数的比重表示。(f)经济增长 用 GDP 可比价格定比增长指数表示(以 1978 年为 100)。