《数理统计第次学习教案.pptx》由会员分享,可在线阅读,更多相关《数理统计第次学习教案.pptx(49页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、会计学1数理统计数理统计(sh l tn j)第次第次第一页,共49页。数理统计是一门对客观不确定现象进行数据搜集、数理统计是一门对客观不确定现象进行数据搜集、整理和分析的科学其目的是了解客观情况,探索整理和分析的科学其目的是了解客观情况,探索数据内在结构及现象之间的规律性数据内在结构及现象之间的规律性.是通过某事物的一部分(样本),来估计事物全部是通过某事物的一部分(样本),来估计事物全部(总体)的特征的,数理统计方法也就是以样本的(总体)的特征的,数理统计方法也就是以样本的特征对未知总体做出合乎逻辑的推论,得到对事物特征对未知总体做出合乎逻辑的推论,得到对事物客观本质的和规律性的认识。客观
2、本质的和规律性的认识。Excel 2007 Excel 2007 能够支持范围广泛的统计计算任务,提能够支持范围广泛的统计计算任务,提供工程和科学统计的基本供工程和科学统计的基本(jbn)(jbn)能力。其中包括能力。其中包括函数和数据分析工具。函数和数据分析工具。第第1 1节节 数理统计数理统计(sh l tn j)(sh l tn j)的的基本概念基本概念第1页/共49页第二页,共49页。按功能划分统计函数的种类包括:按功能划分统计函数的种类包括:按功能划分统计函数的种类包括:按功能划分统计函数的种类包括:(1 1 1 1)频数分布处理)频数分布处理)频数分布处理)频数分布处理(2 2 2
3、 2)描述统计量计算)描述统计量计算)描述统计量计算)描述统计量计算(3 3 3 3)概率)概率)概率)概率(gil)(gil)(gil)(gil)计算计算计算计算(4 4 4 4)参数估计)参数估计)参数估计)参数估计(5 5 5 5)假设检验)假设检验)假设检验)假设检验(6 6 6 6)卡方检验)卡方检验)卡方检验)卡方检验(7 7 7 7)相关、回归分析)相关、回归分析)相关、回归分析)相关、回归分析第第1 1节节 数理统计数理统计(sh l tn j)(sh l tn j)的基的基本概念本概念第2页/共49页第三页,共49页。80个统计(tngj)函数第第1 1节节 数理统计数理统计
4、(sh l tn j)(sh l tn j)的基本概念的基本概念第3页/共49页第四页,共49页。Excel Excel Excel Excel 软件中提供了软件中提供了软件中提供了软件中提供了15151515个数据分析工具:个数据分析工具:个数据分析工具:个数据分析工具:(1 1 1 1)统计绘图、制表)统计绘图、制表)统计绘图、制表)统计绘图、制表(zh bio)(zh bio)(zh bio)(zh bio)(2 2 2 2)描述统计量计算)描述统计量计算)描述统计量计算)描述统计量计算(3 3 3 3)参数估计)参数估计)参数估计)参数估计(4 4 4 4)假设检验)假设检验)假设检验
5、)假设检验(5 5 5 5)方差分析)方差分析)方差分析)方差分析(6 6 6 6)相关、回归分析)相关、回归分析)相关、回归分析)相关、回归分析(7 7 7 7)时间序列分析)时间序列分析)时间序列分析)时间序列分析(8 8 8 8)抽样)抽样)抽样)抽样(9 9 9 9)数据变换)数据变换)数据变换)数据变换第第1 1节节 数理统计数理统计(sh l tn j)(sh l tn j)的基的基本概念本概念第4页/共49页第五页,共49页。第第第第1 1 1 1节节节节 数理统计数理统计数理统计数理统计(sh l tn j)(sh l tn j)(sh l tn j)(sh l tn j)的基
6、的基的基的基本概念本概念本概念本概念第5页/共49页第六页,共49页。uu首先单击首先单击首先单击首先单击“Office“Office“Office“Office 按钮按钮按钮按钮”,然后单击,然后单击,然后单击,然后单击“Excel“Excel“Excel“Excel 选项选项选项选项”。uu单击单击单击单击“加载项加载项加载项加载项”,然后在,然后在,然后在,然后在“管理管理管理管理”框中,选择框中,选择框中,选择框中,选择“Excel“Excel“Excel“Excel 加载宏加载宏加载宏加载宏”。uu单击单击单击单击“转到转到转到转到”。uu在在在在“可用加载宏可用加载宏可用加载宏可用
7、加载宏”框中,选中框中,选中框中,选中框中,选中“分析工具分析工具分析工具分析工具(gngj)(gngj)(gngj)(gngj)库库库库”复选框,复选框,复选框,复选框,然后单击然后单击然后单击然后单击“确定确定确定确定”。uu确定后确定后确定后确定后“数据数据数据数据”选项卡中增加了选项卡中增加了选项卡中增加了选项卡中增加了“数据分析数据分析数据分析数据分析”子项。子项。子项。子项。第第第第1 1 1 1节节节节 数理统计数理统计数理统计数理统计(sh l tn j)(sh l tn j)(sh l tn j)(sh l tn j)的基本的基本的基本的基本概念概念概念概念第6页/共49页第
8、七页,共49页。在进行数据分析的时候,一般首先要对数据进行描述性统计分析在进行数据分析的时候,一般首先要对数据进行描述性统计分析(Descriptive AnalysisDescriptive Analysis),以发现其内在的规律,再选择进一步分),以发现其内在的规律,再选择进一步分析的方法。描述性统计分析要对调查总体所有变量的有关数据做统计析的方法。描述性统计分析要对调查总体所有变量的有关数据做统计性描述,主要包括数据的频数分析、数据的集中趋势分析、数据离散性描述,主要包括数据的频数分析、数据的集中趋势分析、数据离散程度分析、数据的分布、以及程度分析、数据的分布、以及(yj)(yj)一些基
9、本的统计图形。一些基本的统计图形。预处理、提前准备预处理、提前准备第第第第2 2 2 2节节节节 描述性统计描述性统计描述性统计描述性统计(tngj)(tngj)(tngj)(tngj)第7页/共49页第八页,共49页。数据的集中数据的集中(jzhng)(jzhng)趋势分析是用来反映数据的一般趋势分析是用来反映数据的一般水平,常用的指标有平均值、中位数、众数、几何平均值、水平,常用的指标有平均值、中位数、众数、几何平均值、调和平均数等调和平均数等 作用:作用:指出一数据资料内变量的中心位置,标志着资料所代表指出一数据资料内变量的中心位置,标志着资料所代表性状的数量水平和质量水平;性状的数量水
10、平和质量水平;作为样本或资料的代表数与其它资料进行比较作为样本或资料的代表数与其它资料进行比较2.1 2.1 2.1 2.1 数据集中趋势数据集中趋势数据集中趋势数据集中趋势(qsh)(qsh)(qsh)(qsh)分析分析分析分析第8页/共49页第九页,共49页。n n平均数平均数n n 算术算术(sunsh)(sunsh)平均数平均数(average)(average)n n 调和平均数调和平均数(harmean)(harmean)n n 几何平均数几何平均数(geomean)(geomean)2.1 2.1 2.1 2.1 数据数据数据数据(shj)(shj)(shj)(shj)集中趋势分
11、析集中趋势分析集中趋势分析集中趋势分析几何平均可用于平均比率的计算,这里变化比率是在相等长度(chngd)的时间区间内给出的。如果样本观测值包含某种倒数,则可用调和平均,特别地,调和平均可用于以不同的速度通过各路段,求总的平均速度;或在各种条件下,求不同密度的流体的平均密度的计算。第9页/共49页第十页,共49页。调和平均数 某人(mu rn)从C到B的平均速度为30km/h,沿同一路线返回时平均速度为60km/h,求整个往返行程的平均速度为多少?用Excel调和平均数求解:“=HARMEAN(30,60)”40 即40km/h。2.1 2.1 2.1 2.1 数据集中数据集中数据集中数据集中
12、(jzhng)(jzhng)(jzhng)(jzhng)趋势分析趋势分析趋势分析趋势分析第10页/共49页第十一页,共49页。几何几何(j h)(j h)平均数平均数 一雇员在连续三年内的年薪一雇员在连续三年内的年薪增长率分别为增长率分别为6%6%、10%10%和和12%,12%,这里这里增加的百分数是在上一年的薪金增加的百分数是在上一年的薪金基础上计算的基础上计算的,求其三年内的年薪求其三年内的年薪平均增长率平均增长率?用用ExcelExcel几何几何(j h)(j h)平均数平均数求解求解:“=GEOMEAN(1.06,1.1,1.12)”“=GEOMEAN(1.06,1.1,1.12)”
13、1.0930 1.0930 所以所以,薪水的年平均增长率为薪水的年平均增长率为9.3%9.3%。2.1 2.1 2.1 2.1 数据集中数据集中数据集中数据集中(jzhng)(jzhng)(jzhng)(jzhng)趋势分析趋势分析趋势分析趋势分析第11页/共49页第十二页,共49页。n n中位数中位数(MEDIAN)(MEDIAN)2.1 2.1 2.1 2.1 数据数据数据数据(shj)(shj)(shj)(shj)集中趋势分析集中趋势分析集中趋势分析集中趋势分析 中位数是样本的50分位点,它受极端数值的干扰很小。如果加入一个很大的干扰值,中值数仅可能有很小的移动。几何均值和调和(tio
14、h)均值同算术平均值一样,对极端数值也较敏感。它们主要用于数据为对数正态分布或偏斜程度较大时。第12页/共49页第十三页,共49页。下例显示上述几种统计量对极端下例显示上述几种统计量对极端(jdun)(jdun)数值的敏感程度数值的敏感程度 A1:A7=1 1 1 1 1 A1:A7=1 1 1 1 1 1 1001 100 =geomean(A1:A7)1.9307 =geomean(A1:A7)1.9307 =harmean(A1:A7)1.1647 =harmean(A1:A7)1.1647 =average(A1:A7)15.1429 =average(A1:A7)15.1429 =m
15、edian(A1:A7)1 =median(A1:A7)1 2.1 2.1 2.1 2.1 数据集中数据集中数据集中数据集中(jzhng)(jzhng)(jzhng)(jzhng)趋势分析趋势分析趋势分析趋势分析几何(j h)均值调和均值算术平均值中位数中位数第13页/共49页第十四页,共49页。集中趋势集中趋势 数据类型数据类型 测度指标测度指标(zhbio)(zhbio)布形状布形状 是是否整理否整理众数众数 分类变量分类变量 钟形分布钟形分布 顺序变量顺序变量 U U形分布形分布 是是 数值型变量数值型变量 J J形分布形分布中位数中位数 顺序变量顺序变量 数值型变量数值型变量 钟形分布
16、钟形分布 是是数值平均数数值平均数 数值型数值型 变量钟形分布变量钟形分布 均可均可2.1 2.1 2.1 2.1 数据集中数据集中数据集中数据集中(jzhng)(jzhng)(jzhng)(jzhng)趋势分析趋势分析趋势分析趋势分析-小结小结小结小结第14页/共49页第十五页,共49页。算术平均数、调和平均数、几何平均数算术平均数、调和平均数、几何平均数不同的数值平均数不同的数值平均数计算方法,根本原因在于个体量与总量的不同对应计算方法,根本原因在于个体量与总量的不同对应(duyng)(duyng)关系关系总量总量=个体量:如一个班同学的总成绩是每个同学的成绩之个体量:如一个班同学的总成绩
17、是每个同学的成绩之和。和。总量总量=个体量:如个体量:如“十一五十一五”期问经济的总发展速度,就等期问经济的总发展速度,就等于期间各年的经济发展速度连乘积。于期间各年的经济发展速度连乘积。算术平均数和调和平均数是平均指标的两种表现形式算术平均数和调和平均数是平均指标的两种表现形式,是由于是由于我们所掌握的资料不同而采用的不同的计算方法。我们所掌握的资料不同而采用的不同的计算方法。2.1 2.1 2.1 2.1 数据集中趋势分析数据集中趋势分析数据集中趋势分析数据集中趋势分析(fnx)-(fnx)-(fnx)-(fnx)-小结小结小结小结第15页/共49页第十六页,共49页。数据的离散程度数据的
18、离散程度(chngd)(chngd)分析主要是用来反映分析主要是用来反映数据之间的差异程度数据之间的差异程度(chngd)(chngd),常用的指标有极,常用的指标有极差、方差、标准差、四分位数间距等差、方差、标准差、四分位数间距等 作用:作用:描述变量分布的差异程度描述变量分布的差异程度(chngd)(chngd)衡量和比较均值指标的代表性高低衡量和比较均值指标的代表性高低 为抽选样本单位数提供依据为抽选样本单位数提供依据2.2 2.2 2.2 2.2 数据数据数据数据(shj)(shj)(shj)(shj)离散程度分析离散程度分析离散程度分析离散程度分析第16页/共49页第十七页,共49页
19、。极差:为样本最大与最小值之差,是描述数据分散程极差:为样本最大与最小值之差,是描述数据分散程度最简单的度量,但如果数据中出现了极端数据,极端度最简单的度量,但如果数据中出现了极端数据,极端数据有可能就是最大值或最小值,因此极差对极端数据数据有可能就是最大值或最小值,因此极差对极端数据非常敏感。非常敏感。标准差和方差是常用的分散程度度量。它们对于正态标准差和方差是常用的分散程度度量。它们对于正态分布的样本是最优的。但它们对极端数据也是较敏感的。分布的样本是最优的。但它们对极端数据也是较敏感的。偏离偏离(pinl)(pinl)数据整体的一个极端数据可能会使它们的数据整体的一个极端数据可能会使它们
20、的值急剧增大。值急剧增大。2.2 2.2 2.2 2.2 数据离散数据离散数据离散数据离散(lsn)(lsn)(lsn)(lsn)程度分析程度分析程度分析程度分析第17页/共49页第十八页,共49页。样本方差样本方差 为了度量其变异程度,对含有为了度量其变异程度,对含有(hn yu)n(hn yu)n个观测个观测数数x1,x2,xnx1,x2,xn的样本,可以用样本方差反映其变的样本,可以用样本方差反映其变异程度。样本方差的定义公式为:异程度。样本方差的定义公式为:ExcelExcel函数公式:函数公式:2.2 2.2 2.2 2.2 数据离散数据离散数据离散数据离散(lsn)(lsn)(ls
21、n)(lsn)程度分析程度分析程度分析程度分析 VAR(x1,x2,)x1,x2,为对应于总体样本(yngbn)的1到255个参数第18页/共49页第十九页,共49页。n n样本标准差样本标准差样本标准差样本标准差n n方差的定义虽然能够反映变量变异方差的定义虽然能够反映变量变异方差的定义虽然能够反映变量变异方差的定义虽然能够反映变量变异(biny)(biny)程度,但程度,但程度,但程度,但由于离均差取了平方值,使得它与原始数据和单位都由于离均差取了平方值,使得它与原始数据和单位都由于离均差取了平方值,使得它与原始数据和单位都由于离均差取了平方值,使得它与原始数据和单位都不相适应,需要将方差
22、开方还原,方差的标准根值就不相适应,需要将方差开方还原,方差的标准根值就不相适应,需要将方差开方还原,方差的标准根值就不相适应,需要将方差开方还原,方差的标准根值就是标准差。样本标准差的定义公式:是标准差。样本标准差的定义公式:是标准差。样本标准差的定义公式:是标准差。样本标准差的定义公式:n nExcelExcel函数公式:函数公式:函数公式:函数公式:n n n n 2.2 2.2 2.2 2.2 数据离散程度数据离散程度数据离散程度数据离散程度(chngd)(chngd)(chngd)(chngd)分析分析分析分析=STDEV(x1,x2,),x1,x2,为对应(duyng)于总体样本的
23、1到255个参数。第19页/共49页第二十页,共49页。下例显示上述几种统计(tngj)量对极端数值的敏感程度A1:A7=111111100=max(A1:A7)-min(A1:A7)99=stdev(A1:A7)37.4185极差极差标准差标准差2.2 2.2 2.2 2.2 数据数据数据数据(shj)(shj)(shj)(shj)离散程度分析离散程度分析离散程度分析离散程度分析第20页/共49页第二十一页,共49页。2.2 2.2 2.2 2.2 数据离散程度数据离散程度数据离散程度数据离散程度(chngd)(chngd)(chngd)(chngd)分析分析分析分析 设有甲乙两人,对同一名
24、患者采耳垂血,检查红细设有甲乙两人,对同一名患者采耳垂血,检查红细设有甲乙两人,对同一名患者采耳垂血,检查红细设有甲乙两人,对同一名患者采耳垂血,检查红细胞数(万胞数(万胞数(万胞数(万/mm3/mm3/mm3/mm3),每人数五个计数),每人数五个计数),每人数五个计数),每人数五个计数(j sh)(j sh)(j sh)(j sh)盘,得结果盘,得结果盘,得结果盘,得结果为:为:为:为:甲甲甲甲 480 490 500 510 520 480 490 500 510 520 480 490 500 510 520 480 490 500 510 520 乙乙乙乙 440 460 500 5
25、40 560 440 460 500 540 560 440 460 500 540 560 440 460 500 540 560 若让你就评价两人的检验技术(jsh)的好坏,你如何评价?第21页/共49页第二十二页,共49页。2.2 2.2 2.2 2.2 数据数据数据数据(shj)(shj)(shj)(shj)离散程度分析离散程度分析离散程度分析离散程度分析 设有甲乙两人,对同一名患者采耳垂血,检查红细胞数(万设有甲乙两人,对同一名患者采耳垂血,检查红细胞数(万设有甲乙两人,对同一名患者采耳垂血,检查红细胞数(万设有甲乙两人,对同一名患者采耳垂血,检查红细胞数(万/mm3/mm3/mm3
26、/mm3),每人数五个计数),每人数五个计数),每人数五个计数),每人数五个计数(j sh)(j sh)(j sh)(j sh)盘,得结果为:盘,得结果为:盘,得结果为:盘,得结果为:甲甲甲甲 480 490 500 510 520 480 490 500 510 520 480 490 500 510 520 480 490 500 510 520 乙乙乙乙 440 460 500 540 560 440 460 500 540 560 440 460 500 540 560 440 460 500 540 560 两人计数两人计数两人计数两人计数(j sh)(j sh)(j sh)(j s
27、h)的均数都是的均数都是的均数都是的均数都是500500500500,能说两人的检验技术相同,能说两人的检验技术相同,能说两人的检验技术相同,能说两人的检验技术相同吗?不能,因为甲的计数吗?不能,因为甲的计数吗?不能,因为甲的计数吗?不能,因为甲的计数(j sh)(j sh)(j sh)(j sh)结果比较密集,而乙的分散,结果比较密集,而乙的分散,结果比较密集,而乙的分散,结果比较密集,而乙的分散,因此甲的检验精度显然比乙的高。因此甲的检验精度显然比乙的高。因此甲的检验精度显然比乙的高。因此甲的检验精度显然比乙的高。可以用极差来衡量:可以用极差来衡量:可以用极差来衡量:可以用极差来衡量:甲计
28、数甲计数甲计数甲计数(j sh)(j sh)(j sh)(j sh)的极差为的极差为的极差为的极差为520520520520480=40480=40480=40480=40,乙的为乙的为乙的为乙的为560-440=120560-440=120560-440=120560-440=120。可见乙的计数。可见乙的计数。可见乙的计数。可见乙的计数(j sh)(j sh)(j sh)(j sh)较甲的波动大。较甲的波动大。较甲的波动大。较甲的波动大。第22页/共49页第二十三页,共49页。2.2 2.2 2.2 2.2 数据数据数据数据(shj)(shj)(shj)(shj)离散程度分析离散程度分析离
29、散程度分析离散程度分析 设有甲乙两人,对同一名患者采耳垂血,检查红细设有甲乙两人,对同一名患者采耳垂血,检查红细设有甲乙两人,对同一名患者采耳垂血,检查红细设有甲乙两人,对同一名患者采耳垂血,检查红细胞数(万胞数(万胞数(万胞数(万/mm3/mm3/mm3/mm3),每人数),每人数),每人数),每人数(rn sh)(rn sh)(rn sh)(rn sh)五个计数盘,得结五个计数盘,得结五个计数盘,得结五个计数盘,得结果为:果为:果为:果为:甲甲甲甲 480 490 500 510 520 480 490 500 510 520 480 490 500 510 520 480 490 500
30、 510 520 乙乙乙乙 440 460 500 540 560 440 460 500 540 560 440 460 500 540 560 440 460 500 540 560 甲乙甲乙480440490460平均500平均500500500标准误差7.071标准误差22.8510540中位数500中位数500520560标准差15.81标准差50.99方差250方差2600第23页/共49页第二十四页,共49页。10.2 10.2 描述统计描述统计偏度偏度偏度(偏度(SkewnessSkewness)反映一组数据的频数分布)反映一组数据的频数分布曲线的高峰是偏左、偏右还是居中。曲线
31、的高峰是偏左、偏右还是居中。公式:公式:如果如果(rgu(rgu)g1)g10 0为负偏峰,表示曲线高峰偏右,为负偏峰,表示曲线高峰偏右,长尾向左(负)方向延伸;长尾向左(负)方向延伸;g1=0g1=0表示曲线对称;表示曲线对称;g1g10 0为正偏锋,表示曲线高峰偏左,长尾向右为正偏锋,表示曲线高峰偏左,长尾向右(正)方向延伸。(正)方向延伸。已知某地区某时段的平均温度,求出这段时间这些已知某地区某时段的平均温度,求出这段时间这些温度温度的偏度,数据如图所示。的偏度,数据如图所示。这一地区温度的偏度为:这一地区温度的偏度为:在单元格在单元格A12A12中,键入中,键入“=SKEW“=SKEW
32、(B2:B11B2:B11)”,等于等于0.31870.3187。由于偏度值小于零,表示曲线高峰偏。由于偏度值小于零,表示曲线高峰偏左。左。第24页/共49页第二十五页,共49页。10.2 10.2 描述统计描述统计 峰度 公式:峰度(Kurtosis)反映一组数据的频数分布的高峰是平阔峰、正态峰还是尖峭峰。0表示曲线高峰尖且陡峭(duqio),为尖峭峰。例10-10数据。这一地区温度的峰度为:在单元格A12中,键入“=KURT(B2:B11)”,等于1.005。由于峰度值小于零,表示曲线高峰平坦,为平阔峰。第25页/共49页第二十六页,共49页。10.2 10.2 描述统计描述统计n n描述
33、统计工具(gngj)n n1描述统计工具(gngj)功能n n 用于生成对输入区域中数据的单变量分析,提供数据趋中性和易变异等有关信息。第26页/共49页第二十七页,共49页。10.2 10.2 描述统计描述统计n n描述统计工具n n2操作步骤n n用鼠标点击工作表中待分析(fnx)数据的任一单元格。n n选择“工具”菜单的“数据分析(fnx)”子菜单。n n用鼠标双击数据分析(fnx)工具中的“描述统计”选项。n n出现“描述统计”对话框。如下图所示。第27页/共49页第二十八页,共49页。10.2 10.2 描述统计描述统计n n描述统计工具(gngj)第28页/共49页第二十九页,共4
34、9页。10.2 10.2 描述统计描述统计n n描述统计工具n n3结果说明(shumng)n n 描述统计工具生成n n统计指标,如右图所示。第29页/共49页第三十页,共49页。第第第第3 3节节节节 假设检验假设检验假设检验是统计推断的基本问题之一,主要是确定(qudng)关于样本总体特征的判断是否合理的过程。先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程。n假设检验的基本假设检验的基本(jbn)思思想和原理想和原理 n假设检验的步骤假设检验的步骤n总体均值的检验总体均值的检验第30页/共49页第三十一页,共49页。总体总体总体总体假设检验的过程假设检验
35、的过程(guchng)抽取随机样本抽取随机样本抽取随机样本抽取随机样本均值均值均值均值 x x =20=20我认为人口的平我认为人口的平均年龄是均年龄是5050岁岁 提出假设提出假设提出假设提出假设 拒绝假设拒绝假设 别无选择别无选择!作出决策作出决策作出决策作出决策第31页/共49页第三十二页,共49页。首先对几个必要的名词作简要的解释:零假设:即初始判断H0:=0(=50)H0:0H0:0(=50)备选假设(也称对立假设):H1:0(50)H1:0假设检验是在H0成立的前提下,从样本数据中寻找证据来拒绝H0,“接受(jishu)”H1.如果证据不足,则只能不拒绝H0,暂且认为H0正确第第第
36、第3 3节节 假设检验假设检验假设检验假设检验第32页/共49页第三十三页,共49页。提出提出(t ch)假设假设(例题分析例题分析)第33页/共49页第三十四页,共49页。提出提出(t ch)假设假设(例题分析例题分析)第34页/共49页第三十五页,共49页。首先对几个必要的名词作简要的解释:统计量:统计理论(lln)中用来对数据进行分析、检验的变量。根据样本观测结果计算得到的,并据以对零假设和备择假设作出决策的某个样本统计量根据不同的推断要求,可以构造不同的统计量t、z、F、x2第第第第3 3 3 3节节 假设检验假设检验第35页/共49页第三十六页,共49页。显著性水平:在进行假设检验时
37、应该事先规定一个小概率的标准,作为判断的界限,这个小概率标准称为显著性水平是一个概率值原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域表示(biosh)为常用的=0.05,0.01,0.10由研究者事先确定第第3 3节节节节 假设检验假设检验第36页/共49页第三十七页,共49页。P值:P值是在H0成立前提下,比样本统计量更极端的概率 如果P,则拒绝H0,接受H1 如果P,拒绝H0的样本证据不足,就不拒绝H0,暂且认为H0成立 根据统计推断结果,结合相应(xingyng)的专业知识,给出一个专业的结论。第第3 3节节节节 假设检验假设检验假设检验假设检验第37页/共49页第三十八页,共49
38、页。1假设检验的步骤:(1)提出统计假设,零假设H0和备选假设H1(2)规定(gudng)显著水平(3)选取样本统计量(4)在显著水平下,算出统计量服从分布的临界值,确定假设参数的拒绝域第第3 3 3 3节节 假设检验假设检验第38页/共49页第三十九页,共49页。2参数的假设检验工具举例(jl)成对观测值的假设检验 均值假设检验:均值假设检验:t 检验检验(平均值的成对二样本平均值的成对二样本(yngbn)分析分析 双样本双样本(yngbn)等方差、双样本等方差、双样本(yngbn)异异方差方差)Z 检验检验 方差检验:方差检验:F检验检验第39页/共49页第四十页,共49页。(1)双样本的
39、方差检验“F-检验双样本方差”分析工具通过双样本F-检验对两个样本总体的方差进行比较。【例】公司生产某产品,现在分别(fnbi)从同一月份上旬和下旬产品中随意各取若干个,测定其质量指标。假设设备磨损是引起变化的唯一原因,问检验结果是否表明精度显著降低了(=0.05)?上旬产品20.519.819.720.420.120.019.019.9下旬产品19.720.820.519.819.420.619.2第40页/共49页第四十一页,共49页。(2)t 检验检验(jinyn)(双样本等方差、双本异方差)双样本等方差、双本异方差)双样本等方差分析工具可进行双样本t检验。此t检验假设两个数据集取自具有
40、相同方差的分布,故也称作同方差t检验。可以使用此t检验来确定(qudng)两个样本是否来自具有相同总体平均值的分布。双样本异方差分析工具可进行双样本学生t检验。此t检验假设两个数据集取自具有不同方差的分布,故也称作异方差t检验。当两个样本中有截然不同的对象时,可使用此检验。第41页/共49页第四十二页,共49页。(2)t 检验检验(jinyn)(双样本等方差、双本异方差)双样本等方差、双本异方差)【例】今抽测甲班学生10人和乙班学生12人的跳高成绩(chngj)(单位:cm)如下。试分析甲、乙两班的跳高成绩(chngj)是否有差异?甲组15114816413914715516114115715
41、4乙组139165138137141136166167168165164 166第42页/共49页第四十三页,共49页。(3)t 检验检验(jinyn)(平均值的成对二样本分析)平均值的成对二样本分析)用以对两组成对数据进行均值是否相等的检验(jinyn)。实际工作中往往会遇到均值的成对比较,如采用新教育方法前后学生的成绩、进行体育疗法前后患者的血压等。当样本中的观察值存在配对关系时,可以使用“成对双样本t-检验(jinyn)”。第43页/共49页第四十四页,共49页。t 检验检验(平均值的成对二样本平均值的成对二样本(yngbn)分析)分析)用以对两组成对数据进行(jnxng)均值是否相等的
42、检验。实际工作中往往会遇到均值的成对比较,如采用新教育方法前后学生的成绩、进行(jnxng)体育疗法前后患者的血压等。当样本中的观察值存在配对关系时,可以使用“成对双样本t-检验”。第44页/共49页第四十五页,共49页。t 检验检验(jinyn)(平均值的成对二样本分析)平均值的成对二样本分析)【例】由纯化病毒A、B两种处理方法得10组数据(shj),试分析两种方法是否有差异。第45页/共49页第四十六页,共49页。(4)大样本的方差)大样本的方差(fn ch)已知的双样本平均值检验已知的双样本平均值检验大样本指的是样本数量大于30,即默认为服从正态分布,可以用z检验,Excel“数据分析”
43、工具中提供的“z-检验:双样本平均值”可对具有已知方差的平均值进行双样本z-检验。此工具用于检验两个总体平均值之间不存在差异的空值假设(jish),而不是单方或双方的其他假设(jish)。如果方差未知,则应使用工作表函数ZTEST。第46页/共49页第四十七页,共49页。Z Z Z Z检验检验检验检验(jinyn)(jinyn)(jinyn)(jinyn)例:某公司从两个不同例:某公司从两个不同例:某公司从两个不同例:某公司从两个不同(b tn)(b tn)(b tn)(b tn)的供应商处采购某同一的供应商处采购某同一的供应商处采购某同一的供应商处采购某同一产品,为了确认其尺寸的均值差异状况
44、,分别测量得产品,为了确认其尺寸的均值差异状况,分别测量得产品,为了确认其尺寸的均值差异状况,分别测量得产品,为了确认其尺寸的均值差异状况,分别测量得供应商和供应的产品尺寸。已知供应商供应的供应商和供应的产品尺寸。已知供应商供应的供应商和供应的产品尺寸。已知供应商供应的供应商和供应的产品尺寸。已知供应商供应的产品尺寸方差为产品尺寸方差为产品尺寸方差为产品尺寸方差为11113.53.53.53.5,供应商供应的产品尺寸,供应商供应的产品尺寸,供应商供应的产品尺寸,供应商供应的产品尺寸方差为方差为方差为方差为22223.03.03.03.0,数据见表所示。问两供应商的产品,数据见表所示。问两供应商
45、的产品,数据见表所示。问两供应商的产品,数据见表所示。问两供应商的产品尺寸均值有无差异?尺寸均值有无差异?尺寸均值有无差异?尺寸均值有无差异?供应商A150.00152.00156.00152.00149.00150.00148.00151.00 149.00 148.00供应商B150.00152.00150.00151.00149.00148.00151.00151.00 152.00 147.00供应商A151.00147.00151.00153.00156.00144.00149.46149.31 149.17 157.00供应商B150.00148.00149.00151.00151.00154.00148.00147.00 152.00 150.00供应商A149.03154.00146.00153.00152.00150.00152.00153.00 150.00 147.00供应商B152.00154.00155.00145.00152.00151.00153.00152.00 151.00 147.00第47页/共49页第四十八页,共49页。总结(zngji):假设检验步骤情况单样本是否为大样本 30方差是否已知双样本多样(du yn)本统计量第48页/共49页第四十九页,共49页。