《描述性数据的分布和度量实验报告分析(共7页).doc》由会员分享,可在线阅读,更多相关《描述性数据的分布和度量实验报告分析(共7页).doc(7页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上 重庆科技学院学生实验报告课程名称经济预测与决策实验项目名称描述性数据的分布和度量开课学院及实验室实验日期2015-7-3学生姓名学号专业班级指导教师实验成绩一、实验目的和要求实验目的:1、通过对学生各门课程考试成绩的统计整理,使学生掌握统计描述的一般步骤和技巧;2、掌握分布集中趋势的测度指标、离中趋势的测度指标及偏态与峰态的测度指标的计算方法和含义。实验要求:1、输出表格美观,对各描述分布特征的统计指标值的分析要合理。2、在实验报告中要写明实验的操作步骤。3、独立完成实验报告。二、实验内容和原理1、表31是统计学专业研究生入学考试各门课程成绩。根据表中数据按列(课程
2、)进行统计描述,求得描述各门课程数据分布的各种指标值,并分析各门课程数据分布的特征。2、按行统计每位学生的总成绩、平均成绩并进行排序,并按平均成绩进行统计描述,并分析各统计指标的含义。 表31 统计学专业研究生入学考试成绩三、主要仪器设备实验的基本工具: 电脑一台; Microsoft EXCEL 2007 软件一套;四、实验操作方法和步骤操作方法:利用软件数据分析中的统计描述功能,求得描述各门课程数据分布的各种指标值,并分析各门课程数据分布的特征;在进行平均成绩、总成绩的排序以及统计指标的描述。实验步骤:在工具菜单中选择数据分析在数据分析中选择描述统计选择相应的数据区域单击确定 在数据菜单中
3、选择排序框中所选区域选择主关键字此关键字单击确定五、实验记录与处理(数据、图表、计算等)按列(课程)进行统计描述按平均成绩进行统计描述统计每位学生的总成绩、平均成绩并进行排序六、实验结果及分析描述各门课程数据分布的各种指标值平均:平均数是表示一组数据的量数,是指在一组数据中所有数据之和再除以这组数据的个数。标准误差:各测量值误差的平方和的的平方根,故又称为均方根误差。标准误用来衡量。标准误越小,表明与的值越接近,样本对总体越有代表性,用样本统计量推断总体参数的可靠度越大。中位数:代表一个样本、种群或中的一个数值,其可将数值集合划分为相等的上下两部分。对于有限的数集,可以通过把所有观察值高低排序
4、后找出正中间的一个作为中位数。如果观察值有偶数个,通常取最中间的两个数值的作为中位数。众数:众数是在一组数据中,出现次数最多的数据标准差:标准差定义是总体各单位标准值与其平均数离差平方的算术平均数的平方根。它反映组内个体间的离散程度。方差:方差是各个数据分别与其平均数之差的平方的和的,用字母D表示。在概率论和数理统计中,方差用来度量和其(即)之间的偏离程度。峰度:随机变量的四阶与平方的比值又称峰态系数。表征密度分布曲线在处高低的特征数。直观看来,峰度反映了尾部的厚度。偏度:分布密度曲线相对于不对称程度的特征数。直观看来就是密度函数曲线尾部的相对长度。定义上偏度是样本的三阶标准化矩,定义式如下1
5、,其中分别表示二阶和三阶中心距:最大最小值:一组数据中数值最大的值和数值最小的值。分析各门课程数据分布的特征统计数据的分布特征可以从三方面来描述:一是数据分布的集中趋势,反映各项数据向中心值靠拢或聚集的程度,如算术平均数,位置平均数。从统计描述分析中,可以看出四科的平均成绩,政治的平均分为66.76,英语平均分为58.16,数学平均分为56.5,统计学平均分为75.88;四科的众数分别为,政治72,英语66,数学54,统计85;四科的中位数为,政治69.5,英语58,数学57,统计77.5从各科的平均值可以看出,数学的平均分、众数、中位数最差,统计学的平均数、众数、中位数最高。数学的离中趋势最
6、差,统计学的离中趋势很好。这些反映了50名同学的一般水平,统计学成绩较好,其次是政治成绩 ,英语成绩一般,最偏科普遍成绩不太理想的是数学成绩。二是数据分布的的离中趋势,反映各数据远离其中心值的程度,如标准差、方差,从表中我们可以看出政治的标准差为8.,英语是标准差为8.,数学的标准差为18.55081,统计学的标准差为12.9546。离散程度最小的是英语,离散程度最大的是数学。离散程度越大,代表程度就越差。说明数学的成绩的代表性最差,英语成绩的代表性较好。三是峰度和偏度,反映数据分布的形状。从结果可以看出各科偏度系数小于0,说明各科成绩呈负分布,即较高分的人比较多。峰度系数有三科小于0,说明该
7、科成绩分布为低峰曲线。统计学峰度为0.4266大于零,分步曲线为高峰曲线,说明变量值的差异程度小,平均数的代表性好。平均成绩进行统计描述,并分析各统计指标的含义。 按平均成绩进行统计描述后,平均成绩为64.325,中位数为64.375,众数为63.75。反映了50名同学成绩分布的离中趋势。从标准差为9.304和方差等数据中可以看出数据的离散程度,说明平均数的代表性,以及在实际工作中还可以用来衡量稳定性。从峰度为-0.02793,偏度为-0.34343可以看出,偏度系数小于0,说明50名同学的成绩负偏分布,即较高分的人比较多。峰度系数小于零,说明50名同学的成绩分布为低峰曲线,虽然近似于对称分布,的你是峰度低于标准正态分布。 专心-专注-专业