《沈阳建筑大学统计学实验报告超级完整版.pdf》由会员分享,可在线阅读,更多相关《沈阳建筑大学统计学实验报告超级完整版.pdf(24页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、学号:实验报告实验报告课 程 名 称:统计学学年、学期:2014 年秋季实 验 学 时:16 实验项目数:四实验人姓名:专 业 班 级:实验一:统计软件 Spss、Excel 介绍;数据的图表展示实验日期:2014年 11月 20日主要实验内容统计软件 Spss、Excel 的应用介绍;利用软件进行统计数据的整理和绘制各种统计图表。作业:练习题 2.1、实验操作记录:2.1(1)用 Excel 绘制频数分布表:选择【插入】菜单中的【数据透视表或数据透视图】(2)用 Excel 绘制条形图:绘制好频数分布表,选择表中数据,然后选择【插入】中的【条形图】(3)用 Excel 绘制帕累托图:绘制好条
2、形图,然后将条形图中的数据按升序或降序顺序重新排列(4)用 Spass 绘制饼图:【Graphs】【Interactive-Pie-Clustered】,第 2 步将某个分类变量选入【Slice】点击【Pies】2.2(1)用 Excel 生成定量数据的频数分布表:【数据】【数据分析】【直方图】,选择【图表输出】单击【确定】(2)用 Excel 绘制直方图:输入输出区域,然后选择【数据】【数据分析】【直方图】(3)用 Spass 绘制茎叶图:【Analyze】【Descriptive statistics-Explore】第 2 步:将变量选入【Variables】2.3(1)用Excel 绘
3、制环形图:绘制好频数分布表,选择表中数据,然后选择【插入】中的【环形图】再选【环形图】(2)用 Excel 绘制雷达图:绘制好频数分布表,选择表中数据,然后选择【插入】中的【其他图表】再选【雷达图】用 Excel 绘制箱线图:绘制好频数分布表,选择表中数据,然后选择【插入】中的【其他图表】再选【箱线图】第十三教学周实验总结:通过此次试验,加深了我对 Excel 和 Spass 操作软件的应用了解,同时能更好的把实践与理论相结合。首先进行的就是对统计数据的输入与分析。这个输入过程,既要细心也要用心。画图时,不仅是仔细的输入一组数据就可以,还要考虑到整个数据模型的要求,合理而正确的分配输入数据。教
4、师评语:项目预习实验过程作业报告书写出勤和课堂纪律其他本 次 实验成绩得分成绩合计:教师签字:批改日期:为评价家电行业售后服务的质量,随机抽取由100 个家庭构成的一个样本。质量服务的等级分别表示为:A.好;B.较好;C.一般;D.较差;E.差。调查结果如下:(数据略)(1)制作一张频数分布表。家电行业售后服务质量评价等级频数表家电行业售后服务质量评价等级频数表评价等级ABCDE总计频数1421321815100频率14%21%32%18%15%1(2)制作一张条形图,反映评价等级的分布。(3)绘制评价等级的帕累托图。(4)制作一张饼图,反映评价等级的构成。为确定灯泡的使用寿命(单位:小时),
5、在一批灯泡中随机抽取 100 只进行测试,所得数据如下:(数据略)(1)以组距为 10 进行分组,整理成频数分布表。灯泡使用寿命频数分布表灯泡使用寿命频数分布表按销售额分组(万元)650-660660-670670-680680-690690-700700-710710-720720-730730-740740-750合计频数256142618131033100频率0.020.050.060.140.260.180.130.100.030.031.00答:从直方图可以直观地看出,灯泡使用寿命的分布基本上是对称的,右边的尾部稍长一些,灯泡使用寿命接近正态分布。(3)制作茎叶图,并与直方图作比较。
6、使用寿命 Stem-and-Leaf Plot Frequency Stem&Leaf 1.00 Extremes (=749)Stem width:10 Each leaf:1 case(s)答:比较直方图与茎叶图:直方图的数据分布很方便,但原始数据看不到了,茎叶图则不同,不仅可以看出数据的分布,还能保留原始数据的信息。甲、乙两班有 40 名学生,期末统计学考试成绩的分布如下:(1)画出两个班考试成绩的环形图,比较它们的构成。(2)画出雷达图,比较两个班考试成绩的分布是否相似。答:从图中可以看出甲、乙两班的成绩分布不相似,没有相似性。下表是我国10个城市2006年各月份的气温(C)数据:(数
7、据略)绘制各城市月气温的箱线图,并比较各城市气温分布的特点答:从箱线图可看出,这10个城市的月气温存在较大差异,离散程度高的城市为沈阳、北京、郑州、武汉;离散程度低的为海口、昆明、广州。月气温较高的城市主要为中位数较大的海口、广州,月气温较低的为城市中位数较小的沈阳;月气温分布较对称的城市主要有北京、沈阳;月气温分布不对称的城市主要有:海口;月气温存在极值的城市有沈阳、北京、重庆。实验二:用统计量描述数据;概率分布;参数估计实验日期:2014年 11月 27日主要实验内容利用 Spss、Excel 软件对数据进行概括性度量、计算概率分布的概率及概率值,进行参数估计。作业:练习题 3.5、4.4
8、、第十四教学周实验操作记录:3.5 用Excel计算描述统计量:【工具】【数据分析】【描述统计】【确定】【输入区域】【输出选项】【汇总统计】4.4 用Spass绘制正态概率图:第1步:【Analyze】【Descrictive Statistics】【P-PPlot】或【Q-Q Plot】5.3 用 Spass 求 置 信 区 间:第 1 步:选 择【Analyze】然 后 选 择【Descriptivestatistics-Explore】选项进入主对话框5.7 用Spass求两个总体均值之差的区间估计:【Analyze】【Compare MeansPaired-Samples T Test
9、】将两个样本同时选入【Paired Variables】实验总结:实验二主要是对描述统计量的计算,像众数,中位数,标准误差,方差,峰度,偏度,置信度等等。通过这次试验,我进一步熟悉了这些描述统计量的计算公式,懂得了该怎么算这些描述统计量,此外,我还掌握了一些数据统计方面的技能:利用 EXCEL 进行数据处理、描述性统计及区间估计。在具体的操作过程中,我感受到,合理并充分利用 EXCEL 对我们进行数据统计具有很大的作用,能够使我们更加直观地看到数据,一目了然。教师评语:出勤和实验纪律本 次 实验绩成项目得分成绩合计:预习实验过程练习题报告书写其他批改日期:教师签字:一种产品需要人工组装,现有
10、3 种可供选择的组装方法。为检验哪种方法更好,随机抽取 15 个工人,让他们分别用 3 种方法组装。列 1平均标准误差中位数众数列 216平均标准误差165中位数164众数129128列 3平均标准误差中位数众数126126一家人才测评机构对随机抽取的 10 名小企业的经理人用两种方法进行自信心测试,得到自信心测试分数如下:(数据略)构建两种方法平均自信心得分之差d=1-2 的 95%的置信区间。Paired Samples StatisticsPaired Samples StatisticsPair 1方法1方法2Mean0N1010Std.DeviationStd.Error MeanP
11、aired Samples CorrelationsPaired Samples CorrelationsPair 1方法1&方法2N10Paired Samples TestCorrelation.898Sig.000Std.Paired Differences95%Confidence Interval ofStd.ErrorMeanthe DifferenceLowerUppertdf9Sig.(2-tailed).000法2MeanDeviationPair 1 方法1-方答:从表中可以看出两种方法平均自信心得分之差d=1-2 的 95%的置信区间为(6.327,15.673)实验三:
12、假设检验;分类变量的推断;方差分析与实验设计实验日期:2014年 12 月 4日主要实验内容利用 Spss、Excel 软件对数据进行假设检验、分类变量的推断、方差分析与实验设计。作业:练习题 6.9、第十五教学周实验操作记录:6.9(1)1)用 Excelt-检验:双样本等方差假设:第1 步:将原始数据输入到Excel 工作表格中,选【工具】【数据分析】【t-检验:双样本等方差假设】2)用 Excelt-检验:双样本异方差假设:第1 步:将原始数据输入到Excel 工作表格中,选【工具】【数据分析】【t-检验:双样本异方差假设】(2)用 Excelt-检验:F检验双样本方差:第 1 步::【
13、工具】【数据分析】【F检验双样本方差】Spass期望频数不等拟合优度:先指定“频数”变量,【Analyze】【NonparametricTest】【Chi Square】将频数变量选入【Test Variable List】7.4Spass 独立性检验:将列联表中的数据转换为原始数据形式,【Analyze】【DescriptiveStatistics-Crosstabs】,行变量【Row(s)】,列选入【Column(s)】Excel 单因素方差分析:选择“工具”下拉菜单,【数据分析】,然后选择【单因素方差分析】选择【确定】,出现 对话框Excel:可重复双因子分析:选择“工具”下拉菜单,并选
14、择【数据分析】选项,在分析工具中选择【方差分析:可重复双因子分析】Spass:可重复双因子分析:选择【Analyze】,并选择【General Linear Model-Univaiate】进入主对话框。实验总结:实验三是对正态整体的均值,比例和方差进行假设检验,在实验过程中,许多地方让我卡住了,后来通过与老师的交流得知了正确的方法,这才知道是课本知识掌握的不够好。除此之外,实验三还进行了方差分析,这与之前的实验比较相似,都是用到数据分析这个工具,主要的工作量集中在数据的输入和数据的分析方面,比较难的就是就是在根据输入的数据作出数据表,然后要进行数据分析。教师评语:项目预习实验过程练习题报告书
15、写本 次 实得分出勤和实验纪律其他验成 绩成绩合计:批改日期:教师签字:为比较新旧两种肥料对产量的影响,以便决定是否采用新肥料。研究者选择了面积、土壤等条件相同的 40 块田地,分别施用新旧两种肥料,得到的产量数据如下:(数据略)去显著性水平=0.05,检验:(1)新肥料获得的平均产量是否显著地高于旧肥料?假设条件为:1)两种肥料产量的方差未知但相等,即1=2。2)两种肥料产量的方差未知且不相等,即12。解:(1)设1=新肥料,2=旧肥料。H0:1-20;H1:1-1-2 2 0 0。t-t-检验检验:双样本等方差假设双样本等方差假设平均方差观测值合并方差假设平均差dft StatP(T=t)
16、单尾t 单尾临界P(T=t)双尾t 双尾临界变量 1变量 220038201),拒绝原假设,新肥料获得的平均产量显著地高于旧肥料。t-t-检验检验:双样本异方差假设双样本异方差假设平均方差观测值假设平均差dft StatP(T=t)单尾t 单尾临界P(T=t)双尾t 双尾临界变量 1变量 220037202)P=,拒绝原假设,新肥料获得的平均产量显著地高于旧肥料 F-F-检验检验 双样本方差分析双样本方差分析平均方差变量 1变量 2观测值dfFP(F0.025,不拒绝原假设,没有证据表明两种肥料的方差有显著差异。7.27.2一家电视台为了解观众对某档娱乐节目的喜欢程度,对不同年龄段的男女观众进
17、行了调查。男性男性56121625TotalObserved N5612162564Test StatisticsTest StatisticsExpected NResidualChi-SquaredfAsymp.Sig.男性a4.000a.0 cells(.0%)have expected frequencies less than 5.The minimum expected cell frequency is 5.3.解:提出假设:H0:男性观众喜欢该档娱乐节目的比例和女性一致;H1:男性观众喜欢该档娱乐节目的比例和女性不一致由于P=0.8580.05,不拒绝原假设,表明男性观众喜欢该
18、档娱乐节目的比例和女性一致。为分析不同地区的消费者与所购买的汽车价格是否有关,一家汽车企业的销售部门对东部地区、中部地区和西部地区的四百个消费者做抽样调查,检查地区与 所购买的汽车价格是否有关。Case Processing SummaryCase Processing Summary汽车价格*地区N400ValidPercent100.0%ValueaCasesMissingN0df66Percent.0%N400TotalPercent100.0%Pearson Chi-SquareLikelihood RatioN of Valid CasesAsymp.Sig.(2-sided).00
19、0.000400a.0 cells(.0%)have expected count less than 5.The minimum expected count is 21.00.汽车价格汽车价格*地区地区 CrosstabulationCrosstabulation汽车价格1020万元CountExpected Count东部地区50203040140地区西部地区50402010120中部地区60402020140Total160100707040010万元以下CountExpected Count2030万元CountExpected Count30万元以上CountExpected Co
20、untTotalCountExpected Count解:提出假设:H0:地区与所购买的汽车价格独立;H1:地区与所购买的汽车价格不独立由于P值接近于0,拒绝原假设,表明地区与所购买的汽车价格不独立。某家电制造公司准备购进一批 5#电池,现有 A、B、C 三个电池生产企业愿意供货,为比较它们生产的电池质量,从每个企业各随机抽取5 只电池,经试验得其寿命(单位:h)数据如下。试分析三个企业生产的电池的平均寿命之间有无显著差异()。如果有差异,试用多重比较检验哪些企业之间有差异?解:单因素方差分析:提出假设:H0:1=2=3;H1:1,2,3 不全为 0SUMMARY组列 1列 2列 3方差分析差
21、异源组间组内总计观测数555求和222150213平均3021214方差10SSdfMSFP-valueF crit832由于 F=F0.05(2,12)=3.89,因此拒绝原假设 H0,即三个企业生产的电池的平均寿命之间有显著差异。多重比较检验:一:提出假设:检验 1:H0:1=2 H1:12检验 2:H0:1=3 H1:13检验 3:H0:2=3 H1:23二:计算检验的统计量:y1-y2=14.4y1-y3=1.8y2-y3=12.6三:计算 LSD四:做出决策y1-y2,拒绝 H0,A 企业和 B 企业的电池的平均寿命之间有显著差异y1-y3=1.85.85,不拒绝 H0,A 企业和
22、C 企业的电池的平均寿命之间没有显著差异y2-y3拒绝 H0,B 企业和 C 企业的电池的平均寿命之间有显著差异。城市道路交通管理部门为研究不同的路段和不同的时段对行车时间的影响,让一名交通警察分别在 3 个路段的高峰期与非高峰期亲自驾车进行试验,通过试验共获得 30 个行车时间的数据单位:分。试分析路段、时段以及路段和时段的交互作用对行车时间的影响。Exel:Exel:方差分析:可重复双因素分析方差分析:可重复双因素分析SUMMARY高峰期观测数求和平均方差非高峰期观测数求和平均方差总计观测数求和平均方差方差分析差异源行列误差路段 1551503010SSdf9218MS路段 35510FP
23、-valueF crit总计1515路段 25512110总计29解:H0:无影响H1:有影响1.路段对行车时间的影响P=4.18E-08,表明路段对行车时间的影响显著。2.时段以对行车时间的影响P=3.06E-08,表明时段以对行车时间的影响显著。F=0.026956F,拒绝原假设,即线性关系显著。(5)y=734.6928+5000=2278.1078(元)(6)置信区间为(1990.74915,2565.46399)随机抽取 10 家航空公司,对其最近一年的航班正点率和顾客投诉次数金子那个调查,所得数据如下:(数据略)(1)用航班正点率作自变量,顾客投诉次数作因变量,求出估计的回归方程,
24、并解释其意义。(2)检验回归系数的显著性。(=0.05)(3)如果航班的正点率为 80%,估计顾客的投诉次数。Model SummaryModel Summaryb bModel1R.869aR Square.755Adjusted R Square.724Std.Error of the Estimatea.Predictors:(Constant),航班正点率(%)Model SummaryModel Summaryb bModel1R.869aR Square.755Adjusted R Square.724Std.Error of the Estimatea.Predictors:(C
25、onstant),航班正点率(%)b.Dependent Variable:投诉次数(次)ANOVAANOVAb bModel1RegressionResidualTotala.Predictors:(Constant),航班正点率(%)b.Dependent Variable:投诉次数(次)Sum of Squaresdf189Mean SquareFSig.001aCoefficientsaStandardizedUnstandardized CoefficientsModel1(Constant)航班正点率(%)a.Dependent Variable:投诉次数(次)Residuals
26、StatisticsaBStd.Error.948CoefficientsBetatSig.000.001Predicted ValueStd.Predicted ValueStandard Error of Predicted ValueAdjusted Predicted ValueResidualStd.ResidualStud.ResidualDeleted ResidualStud.Deleted ResidualMahal.DistanceCooks DistanceCentered Leverage ValueMinimum.55.001.001.000Maximum.608Me
27、an.000.000.000.075.100.900.441.100Std.Deviation.943.184N101010101010101010101010a.Dependent Variable:投诉次数(次)回归系数的意义:回归系数-4.701 表示航班正点率每增加 1%,顾客投诉次数平均下降 4.7 次。(2)检验回归系数显著性:P=0.00110.05,表明回归系数显著,即航班正点率对投诉次数有显著影响。(3)航班正点率为 80%时估计投诉次数为 54.139;16.479);46.567);下表是 1991-2008 年我国小麦产量(单位:万吨)数据:(数据略)(1)分别采用 3
28、 期移动平均法和指数平滑法(=0.3)预测 2009 年的小麦产量。将实际值和预测值绘图进行比较。(2)分析预测误差,说明哪种方法预测更合适?解:(1)年份199119921993199419951996199719981999200020012002200320042005200620072008小麦产量移动平均法K=3预测误差9595.310158.710639.010131.0508.09929.710242.5-312.810220.710263.1-42.411056.910402.4654.512328.911202.21126.710972.611452.8-480.211388
29、.011563.2-175.29963.610774.7-811.19387.310246.3-859.09029.09460.0-431.08648.89021.7-372.99195.28957.7237.59744.59196.2548.310846.69928.8917.810929.810507.0422.811246.411007.6238.8指数平滑法预测误差9595.3563.49764.3874.710026.7-97.09997.6223.110064.5992.410362.21966.710952.220.410958.4429.611087.2-1123.610750
30、.2-1362.910341.3-1312.39947.6-1298.89558.0-362.89449.1295.49537.71308.99930.4999.410230.21016.22009预测误差和11088.11170.010535.13132.6(1)3期移动平均法预测值为11088.1万吨,指数平滑法预测值为10535.1万吨。(2)移动平均法的预测误差比指数平滑法的小,所以前者更合适。下表是某只股票连续 35 个交易日的收盘价格。分别拟合回归直线Yt=b0+b1t、二阶曲线Yt=b0+b1t+b2t和三阶曲线Yt=b0+b1t+b2t+b3t,并对结果进行比较。直线直线Int
31、erceptX Variable 1InterceptX Variable 1X Variable 2二阶曲线二阶曲线InterceptX Variable 1X Variable 2X Variable 3三阶曲线三阶曲线各趋势方程为:线性趋势:二阶曲线:三阶曲线:根据趋势方程求得的预测值和预测误差如下表:观测值观测值 Y Y时间时间 t t预测预测372370374375误差平方误差平方预测预测误差平方误差平方预测预测误差平方误差平方直线直线二阶曲线二阶曲线三阶曲线三阶曲线1234567891011121314151617181920212223242526273773773743723733723693673673653633593583593603573563523483533563563562829303132333435合计合计359360357357355356363365不同趋势线预测的标准误差如下:直线:二阶曲:三阶曲线:比较各预测误差可知,直线的误差最大,三阶曲线的误差最小。从不同趋势方程的预测图也可以看出,三阶曲线与原序列的拟合