《统计学第四版小抄.ppt》由会员分享,可在线阅读,更多相关《统计学第四版小抄.ppt(37页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、【例例例例】某某商商场场甲甲、乙乙、丙丙三三种种商商品品20072007年年和和20082008年年的的资资料料。要要求求计计算算三三种种商商品品的的销销售售量量总总指指数数,以以综综合合反反映映市市场场商商品品销销售数量的变化售数量的变化 加权综合指数(例题分析)加权综合指数(例题分析)拉氏指数为拉氏指数为帕氏指数为帕氏指数为中位数(位置和数值的确定)位置确定位置确定数值确定数值确定数值型数据的四分位数(9个数据的算例)【例例】:9个家庭的人均月收入数据(4种方法计算)原始数据原始数据:1500 750 780 1080 850 960 2000 1250 1630排排 序序:750 780
2、 850 960 1080 1250 1500 1630 2000位位 置置:1 2 3 4 5 6 7 8 9离散系数(例题分析)某管理局所属某管理局所属8家企业的产品销售数据家企业的产品销售数据企业编号企业编号产品销售额(万元)产品销售额(万元)x1销售利润(万元)销售利润(万元)x212345678170220390430480a65095010008.112.518.022.026.540.064.069.0【例例例例 】某某管管理理局局抽抽查查了了所所属属的的8 8家家企企业业,其其产产品品销销售售数数据如表。试比较产品销售额与销售利润的离散程度据如表。试比较产品销售额与销售利润的离
3、散程度离散系数(例题分析)结结论论:计算结果表明,v1v2,说明产品销售额的离散程度小于销售利润的离散程度 v v1 1=536.25536.25309.19309.19=0.5770.577v v2 2=32.521532.521523.0923.09=0.7100.710双侧检验与单侧检验(假设的形式)假设假设研究的问题研究的问题双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验H0 =0 0 0 0 0 0H1 0 0 0 0总体均值的检验(检验统计量)总体总体 是否已知是否已知?用用样本标样本标准差准差S代替代替 t 检验检验小小小样本量样本量n否否否是是是z 检验检验 z 检验检验大大
4、大2 已知均值的检验(例题分析)【例例】某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为=0.025。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(0.05)H0:=0.081H1:0.081 =0.05n=200双侧检验双侧检验检验统计量检验统计量检验统计量检验统计量:决策决策决策决策:在在 =0.05=0.05的水平上拒绝的水平上拒绝H0H0结论结论结论结论:有证据表明新机床加工的零件的椭圆度与以有证据表明新机床加工的零件的椭圆度
5、与以前有显著差异前有显著差异2 未知小样本均值的检验(例题分析)【例例】某机器制造出的肥皂厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的显著性水平检验机器性能良好的假设。双侧检验双侧检验H0:=5 H1:5 =0.05df=10-1=92 未知小样本均值的检验(例题分析)H0:=5H1:5 =0.05df=10-1=9临界值临界值(s):检验统计量检验统计量检验统计量检验统计量:在在 =0.05=0.05的水平上拒绝的水平上拒绝H H0 0说明该机器的性能不好说明该机器的性能不好 决策:决策:决策:决策:结论:结论
6、:结论:结论:t t0 02.2622.262-2.262-2.262.025.025拒绝拒绝 H H0 0拒绝拒绝 H H0 0.025.025一个总体比例的检验(例题分析)【例例】一项统计结果声称,某市老年人口(年龄在65岁以上)的比重为14.7%,该市老年人口研究会为了检验该项统计是否可靠,随机抽选了400名居民,发现其中有57人年龄在65岁以上。调查结果是否支持该市老年人口比重为14.7%的看法?(=0.05)双侧检验双侧检验一个总体比例的检验(例题分析)H0:=14.7%H1:14.7%=0.05n=400临界值临界值(s):检验统计量检验统计量检验统计量检验统计量:在在 =0.05
7、=0.05的水平上不拒绝的水平上不拒绝H H0 0该市老年人口比重为该市老年人口比重为14.7%14.7%决策决策决策决策:结论结论结论结论:Z Z0 01.961.96-1.96-1.96.025.025拒绝拒绝 H H0 0拒绝拒绝 H H0 0.025025方差的卡方(2)检验(例题分析)【例例】某厂商生产出一种新型的饮料装瓶机器,按设计要求,该机器装一瓶一升(1000cm3)的饮料误差上下不超过1cm3。如果达到设计要求,表明机器的稳定性非常好。现从该机器装完的产品中随机抽取25瓶,分别进行测定(用样本减1000cm3),得到如下结果。检验该机器的性能是否达到设计要求 (=0.05)0
8、.3-0.4-0.71.4-0.6-0.3-1.50.6-0.91.3-1.30.71-0.50-0.60.7-1.5-0.2-1.9-0.51-0.2-0.61.1双侧检验双侧检验方差的卡方(2)检验(例题分析)H0:2=1H1:2 1 =0.05df=25-1=24临界值临界值(s):统计量统计量统计量统计量:在在 =0.05=0.05的水平上不拒绝的水平上不拒绝H H0 0不能认为该机器的性能未达到不能认为该机器的性能未达到设计要求设计要求 2 220 0 039.3639.3639.3612.4012.4012.40 /2=.05/2=.05/2=.05决策决策决策决策:结论结论结论结
9、论:构造检验的统计量(例题分析)构造检验的统计量(计算总误差平方和 SST)1.全部观察值 与总平均值 的离差平方和2.反映全部观察值的离散状况3.其计算公式为 前例的计算结果前例的计算结果 SST SST=(57-47.869565)=(57-47.869565)2 2+(58-47.869565)(58-47.869565)2 2 =115.9295 =115.9295构造检验的统计量(计算组间平方和 SSA)1.各组平均值 与总平均值 的离差平方和2.反映各总体的样本均值之间的差异程度3.该平方和既包括随机误差,也包括系统误差4.计算公式为 前例的计算结果前例的计算结果 SSA SSA=
10、1456.608696=1456.608696构造检验的统计量(计算组内平方和 SSE)1.每个水平或组的各样本数据与其组平均值的离差平方和2.反映每个样本各观察值的离散状况3.该平方和反映的是随机误差的大小4.计算公式为 前例的计算结果前例的计算结果 SSE SSE=2708=2708构造检验的统计量(三个平方和的关系)总离差平方和(SST)、误差项离差平方和(SSE)、水平项离差平方和(SSA)之间的关系SST=SSA+SSE 前例的计算结果前例的计算结果 4164.608696=1456.608696+2708 4164.608696=1456.608696+2708 构造检验的统计量(
11、计算均方 MS)1.组组间间方方差差:SSA的均方,记为MSA,计算公式为2.组组内内方方差差:SSE的均方,记为MSE,计算公式为构造检验的统计量(计算检验统计量 F)1.将MSA和MSE进行对比,即得到所需要的检验统计量F2.当H0为真时,二者的比值服从分子自由度为k-1、分母自由度为 n-k 的 F 分布,即 关系强度的测量 1.变量间关系的强度用自变量平方和(SSA)占总平方和(SST)的比例大小来反映2.自变量平方和占总平方和的比例记为R2,即3.其平方根R就可以用来测量两个变量之间的关系强度 关系强度的测量(例题分析)R=0.591404结论结论行业(自变量)对投诉次数(因变量)的
12、影响效应占总效应的34.9759%,而残差效应则占65.0241%。即行业对投诉次数差异解释的比例达到近35%,而其他因素(残差变量)所解释的比例近为65%以上 R=0.591404,表明行业与投诉次数之间有中等以上的关系 利用 P 值进行检验(决策准则)1.单侧检验若p-值 ,不拒绝 H0若p-值 /2,不拒绝 H0若p-值 /2,拒绝 H0总体均值的区间估计(大样本)1.假定条件总体服从正态分布,且方差()已知如果不是正态分布,可由正态分布来近似(n 30)2.使用正态分布统计量 z3.总体均值总体均值 在在1-1-置信水平下的置信水平下的置信区间为置信区间为总体均值的区间估计(例题分析)
13、【例例例例 】一一家家食食品品生生产产企企业业以以生生产产袋袋装装食食品品为为主主,为为对对食食品品质质量量进进行行监监测测,企企业业质质检检部部门门经经常常要要进进行行抽抽检检,以以分分析析每每袋袋重重量量是是否否符符合合要要求求。现现从从某某天天生生产产的的一一批批食食品品中中随随机机抽抽取取了了2525袋袋,测测得得每每袋袋重重量量如如下下表表所所示示。已已知知产产品品重重量量的的分分布布服服从从正正态态分分布布,且且总总体体标标准准差差为为10g10g。试试估估计计该该批批产产品品平平均均重重量量的的置信区间,置信水平为置信区间,置信水平为95%95%25袋食品的重量袋食品的重量 11
14、2.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3总体均值的区间估计(例题分析)解解解解:已已 知知 N N(,10102 2),n n=25,=25,1-1-=95%95%,z z/2/2=1.96=1.96。根根据据样样本本数数据据计计算算得得:。由由于于是是正正态态总总体体,且且方方差差已已知知。总总体体均均值值 在在1-1-置置信信水平下的置信区间为水平下的置信区间为该食品平均重量的置信区间为
15、该食品平均重量的置信区间为101.44g109.28g101.44g109.28g总体均值的区间估计(例题分析)【例例例例】一一家家保保险险公公司司收收集集到到由由3636个个投投保保人人组组成成的的随随机机样样本本,得得到到每每个个投投保保人人的的年年龄龄(单单位位:周周岁岁)数数据据如下表。试建立投保人年龄如下表。试建立投保人年龄90%90%的置信区间的置信区间 36个投保人年龄的数据个投保人年龄的数据 233539273644364246433133425345544724342839364440394938344850343945484532总体均值的区间估计(例题分析)解解解解:已已
16、知知n n=36,=36,1-1-=90%90%,z z/2/2=1.645=1.645。根根据据样样本本数数据计算得:据计算得:,总体均值总体均值 在在1-1-置信水平下的置信区间为置信水平下的置信区间为投保人平均年龄的置信区间为投保人平均年龄的置信区间为37.3737.37岁岁41.6341.63岁岁总体均值的区间估计(小样本)1.假定条件总体服从正态分布,但方差()未知小样本(n 30)2.使用 t 分布统计量3.总体均值 在1-置信水平下的置信区间为总体均值的区间估计(例题分析)【例例例例】已已知知某某种种灯灯泡泡的的寿寿命命服服从从正正态态分分布布,现现从从一一批批灯灯泡泡中中随随机
17、机抽抽取取1616只只,测测得得其其使使用用寿寿命命(单单位位:h)h)如如下。建立该批灯泡平均使用寿命下。建立该批灯泡平均使用寿命95%95%的置信区间的置信区间16灯泡使用寿命的数据灯泡使用寿命的数据 1510152014801500145014801510152014801490153015101460146014701470总体均值的区间估计(例题分析)解:解:解:解:已知已知 N N(,2 2),n n=16,1-=16,1-=95%=95%,t t/2/2=2.131=2.131 根据样本数据计算得:根据样本数据计算得:,总体均值总体均值 在在1-1-置信水平下的置信区间为置信水平
18、下的置信区间为该该种种灯灯泡泡平平均均使使用用寿寿命命的的置置信信区区间间为为1476.81476.8h h1503.21503.2h h总体比例的区间估计1.假定条件总体服从二项分布可以由正态分布来近似2.使用正态分布统计量 z3.3.3.总体比例总体比例总体比例 在在在1-1-1-置信水平下置信水平下置信水平下的置信区间为的置信区间为的置信区间为总体比例的区间估计(例题分析)【例例例例】某某城城市市想想要要估估计计下下岗岗职职工工中中女女性性所所占占的的比比例例,随随机机地地抽抽取取了了100100名名下下岗岗职职工工,其其中中6565人人为为女女性性职职工工。试试以以95%95%的的置置
19、信信水水平平估估计计该该城城市市下下岗岗职职工工中中女女性性比比例例的置信区间的置信区间解解解解:已已知知 n n=100=100,p p65%65%,1 1-=95%95%,z z/2/2=1.96=1.96该该城城市市下下岗岗职职工工中中女女性性比比例例的的置置信信区间为区间为55.65%74.35%55.65%74.35%总体方差的区间估计(例题分析)【例例例例】一一家家食食品品生生产产企企业业以以生生产产袋袋装装食食品品为为主主,现现从从某某天天生生产产的的一一批批食食品品中中随随机机抽抽取取了了2525袋袋,测测得得每每袋袋重重量量如如下下表表所所示示。已已知知产产品品重重量量的的分
20、分布布服服从从正正态态分分布布。以以95%95%的置信水平建立该种食品重量方差的置信区间的置信水平建立该种食品重量方差的置信区间 25袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3总体方差的区间估计(例题分析)解解解解:已知已知n n2525,1-1-95%,95%,根据样本数据计算得根据样本数据计算得 s s2 2=93.21=93.21 2 2置信度为置信度为95%95%的置信区间为的置信区间为 该企业生产的食品总体重量标准差的的置信区该企业生产的食品总体重量标准差的的置信区间为间为7.54g13.43g7.54g13.43g