《第五抽样与参数估计课件.ppt》由会员分享,可在线阅读,更多相关《第五抽样与参数估计课件.ppt(118页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第五抽样与参数估计第五抽样与参数估计第1页,此课件共118页哦第第 5 章章 抽样与参数估计抽样与参数估计5.1 抽样与抽样分布抽样与抽样分布5.2 参数估计的基本方法参数估计的基本方法 5.3 总体均值的区间估计总体均值的区间估计5.4 总体比例的区间估计总体比例的区间估计5.5 样本容量的确定样本容量的确定第2页,此课件共118页哦学习目标学习目标1.理解概率抽样方法理解概率抽样方法2.理解抽样分布理解抽样分布3.估计量与估计值的概念估计量与估计值的概念4.点估计与区间估计的区别点估计与区间估计的区别5.评价估计量优良性的标准评价估计量优良性的标准6.总体均值的区间估计方法总体均值的区间估
2、计方法7.总体比例的区间估计方法总体比例的区间估计方法8.样本容量的确定方法样本容量的确定方法第3页,此课件共118页哦5.1 抽样与抽样分布抽样与抽样分布一一.什么是抽样推断什么是抽样推断二二.抽样方法抽样方法三三.抽样分布抽样分布四四.抽样推断中常用的统计量及抽样推断中常用的统计量及其分布其分布第4页,此课件共118页哦一、抽样推断一、抽样推断(概念要点)(概念要点)是根据观测到的样本数是根据观测到的样本数据对总体作出推测,据对总体作出推测,这种推测伴随某种不这种推测伴随某种不确定性,需要用概率确定性,需要用概率来表示其可靠程度,来表示其可靠程度,这是统计推断的一个这是统计推断的一个重要特
3、点。重要特点。第5页,此课件共118页哦统计推断的过程统计推断的过程样样本本总体总体样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量例如:样本均例如:样本均例如:样本均例如:样本均例如:样本均例如:样本均值、比例、方值、比例、方值、比例、方值、比例、方值、比例、方值、比例、方差差差差差差总体均值、比例、总体均值、比例、方差等方差等第6页,此课件共118页哦二、抽样方法二、抽样方法第7页,此课件共118页哦抽样方法抽样方法第8页,此课件共118页哦(一一)概率抽样概率抽样(probability sampling)1.也称随机抽样也称随机抽样2.特点特点n n按一定的概率以随机原则抽
4、取样本按一定的概率以随机原则抽取样本l l抽取样本时使每个单位都有一定的机会被抽中抽取样本时使每个单位都有一定的机会被抽中抽取样本时使每个单位都有一定的机会被抽中抽取样本时使每个单位都有一定的机会被抽中n n每每个个单单位位被被抽抽中中的的概概率率是是已已知知的的,或或是是可可以计算出来的以计算出来的 n n当当用用样样本本对对总总体体目目标标量量进进行行估估计计时时,要要考考虑到每个样本单位被抽中的概率虑到每个样本单位被抽中的概率第9页,此课件共118页哦简单随机抽样简单随机抽样(simple random sampling)1.从从总总体体N N个个单单位位中中随随机机地地抽抽取取n n个
5、个单单位位作作为为样样本本,每每个单位入选样本的概率是相等的个单位入选样本的概率是相等的2.最基本的抽样方法,是其它抽样方法的基础最基本的抽样方法,是其它抽样方法的基础3.3.特点特点特点特点n n简单、直观,在抽样框完整时,可直接从中抽取样本简单、直观,在抽样框完整时,可直接从中抽取样本简单、直观,在抽样框完整时,可直接从中抽取样本简单、直观,在抽样框完整时,可直接从中抽取样本n n用样本统计量对目标量进行估计比较方便用样本统计量对目标量进行估计比较方便用样本统计量对目标量进行估计比较方便用样本统计量对目标量进行估计比较方便4.局限性局限性n n当当当当N N很大时,不易构造抽样框很大时,不
6、易构造抽样框很大时,不易构造抽样框很大时,不易构造抽样框n n抽出的单位很分散,给实施调查增加了困难抽出的单位很分散,给实施调查增加了困难抽出的单位很分散,给实施调查增加了困难抽出的单位很分散,给实施调查增加了困难n n没有利用其它辅助信息以提高估计的效率没有利用其它辅助信息以提高估计的效率没有利用其它辅助信息以提高估计的效率没有利用其它辅助信息以提高估计的效率第10页,此课件共118页哦简单随机抽样简单随机抽样(simple random sampling)抽取方式抽取方式:总体总体N个单位从编号,从中抽取个单位从编号,从中抽取n个单位个单位1、抽签法、抽签法:做材质相同的做材质相同的N个标
7、签,不放回抽取个标签,不放回抽取2、随机数法:、随机数法:随机数表随机数表随机数色子随机数色子摇奖机摇奖机第11页,此课件共118页哦分层抽样分层抽样(stratified sampling)1.将将抽抽样样单单位位按按某某种种特特征征或或某某种种规规则则划划分分为为不不同同的的层层,然然后后从从不不同同的的层层中中独独立立、随随机机地抽取样本地抽取样本层层1 1层层2 2层层N N总体总体第12页,此课件共118页哦分层抽样分层抽样(stratified sampling)1.分分层层抽抽样样的的值值依依赖赖于于层层内内各各元元素素是是同同质质性性(相似的)。使层内差异小,层间差异大(相似的
8、)。使层内差异小,层间差异大2.优点优点n n保保证证样样本本的的结结构构与与总总体体的的结结构构比比较较相相近近,从而提高估计的精度从而提高估计的精度n n组织实施调查方便组织实施调查方便n n既既可可以以对对总总体体参参数数进进行行估估计计,也也可可以以对对各各层层的目标量进行估计的目标量进行估计第13页,此课件共118页哦分层抽样分层抽样(抽样方法)(抽样方法)1、等额分配法等额分配法:在各类型组中分配同等单位数。在各类型组中分配同等单位数。n1=n2=ni2、等比例抽样:等比例抽样:按各层在总体中所占的比例分配样按各层在总体中所占的比例分配样本单位数。本单位数。第14页,此课件共118
9、页哦整群抽样整群抽样(cluster sampling)1.将将总总体体中中若若干干个个单单位位合合并并为为组组(群群),抽抽样样时时直直接接抽抽取取群群,然然后后对对中中选选群群中中的的所所有有单单位位全部实施调查全部实施调查群群1 1群群2 2群群N N总体总体第15页,此课件共118页哦整群抽样整群抽样(cluster sampling)1.整整群群抽抽样样的的值值依依赖赖于于每每一一群群对对总总体体的的代代表表性性,当当群群中中元元素素不不同同质质(不不相相似似)时时,整整群群抽样得到的结果最佳。抽样得到的结果最佳。2.特点特点n n抽样时只需群的抽样框,可简化工作量抽样时只需群的抽样
10、框,可简化工作量n n调调查查的的地地点点相相对对集集中中,节节省省调调查查费费用用,方方便调查的实施便调查的实施n n缺点是估计的精度较差缺点是估计的精度较差第16页,此课件共118页哦系统抽样系统抽样(systematic sampling)1.将将总总体体中中的的所所有有单单位位(抽抽样样单单位位)按按一一定定顺顺序序排排列列,在在规规定定的的范范围围内内随随机机地地抽抽取取一一个个单单位位作作为为初初始始单单位位,然然后后按按事事先先规规定定好好的的规则确定其它样本单位。规则确定其它样本单位。2.优点:操作简便,可提高估计的精度优点:操作简便,可提高估计的精度3.缺点:对估计量方差的估
11、计比较困难缺点:对估计量方差的估计比较困难第17页,此课件共118页哦系统抽样系统抽样(抽样方法)、无关标志排队等距抽样无关标志排队等距抽样无关标志排队等距抽样无关标志排队等距抽样如:产品质量检查按生产时间顺序排队;学生成绩调查按学号排队;如:产品质量检查按生产时间顺序排队;学生成绩调查按学号排队;如:产品质量检查按生产时间顺序排队;学生成绩调查按学号排队;如:产品质量检查按生产时间顺序排队;学生成绩调查按学号排队;居民住户收入调查按门牌号排序。居民住户收入调查按门牌号排序。居民住户收入调查按门牌号排序。居民住户收入调查按门牌号排序。、有关标志排队等距抽样有关标志排队等距抽样有关标志排队等距抽
12、样有关标志排队等距抽样如:职工家计调查按工资水平排队;农产量抽样调查,按平均亩产排序。如:职工家计调查按工资水平排队;农产量抽样调查,按平均亩产排序。如:职工家计调查按工资水平排队;农产量抽样调查,按平均亩产排序。如:职工家计调查按工资水平排队;农产量抽样调查,按平均亩产排序。3 3、起点和间隔的确定:起点和间隔的确定:起点和间隔的确定:起点和间隔的确定:随机起点:间隔随机起点:间隔随机起点:间隔随机起点:间隔 k=N/nk=N/n,a a1 1=r,a=r,a2 2=r+k,a=r+k,a3 3=r+2ka=r+2kan n=r+(n-1)k=r+(n-1)k中点起点等距抽样中点起点等距抽样
13、中点起点等距抽样中点起点等距抽样:a:a1 1=k/2,a=k/2,a2 2=k/2+k,a=k/2+k,a3 3=k/2+2k=k/2+2k a an n=k/2+(n-1)k=k/2+(n-1)k随机起点对称等距抽样随机起点对称等距抽样随机起点对称等距抽样随机起点对称等距抽样:a:a1 1=r,a=r,a2 2=(2k+1)-r,a=(2k+1)-r,a3 3=2k+r,=2k+r,a a4 4=(4k+1)-r,a=(4k+1)-r,a5 5=4k+r=4k+r第18页,此课件共118页哦多阶段抽样多阶段抽样(multi-stage sampling)1.1.先先先先将将将将总总总总体体
14、体体单单单单位位位位划划划划分分分分成成成成若若若若干干干干大大大大群群群群,大大大大群群群群内内内内再再再再分分分分成成成成若若若若干干干干小小小小群群群群。先先先先按按按按某某某某种种种种方方方方法法法法抽抽抽抽取取取取大大大大群群群群,然然然然后后后后在在在在中中中中选选选选群群群群中中中中抽抽抽抽取取取取小小小小群群群群,再再再再进进进进一一一一步步步步抽抽抽抽样样样样,从从从从选中的群中抽取出若干个单位进行调查选中的群中抽取出若干个单位进行调查选中的群中抽取出若干个单位进行调查选中的群中抽取出若干个单位进行调查n n二二二二阶阶阶阶抽抽抽抽样样样样中中中中群群群群是是是是初初初初级级
15、级级抽抽抽抽样样样样单单单单位位位位,第第第第二二二二阶阶阶阶段段段段抽抽抽抽取取取取的的的的是是是是最最最最终终终终抽抽抽抽样样样样单单单单位位位位。将将将将该该该该方方方方法法法法推推推推广广广广,使使使使抽抽抽抽样样样样的的的的阶阶阶阶段段段段数数数数增增增增多多多多,就就就就称称称称为为为为多多多多阶阶阶阶段段段段抽样抽样抽样抽样2.2.具有整群抽样的优点,保证样本相对集中,节约调查费用具有整群抽样的优点,保证样本相对集中,节约调查费用具有整群抽样的优点,保证样本相对集中,节约调查费用具有整群抽样的优点,保证样本相对集中,节约调查费用3.3.适适适适用用用用于于于于大大大大规规规规模模
16、模模的的的的抽抽抽抽样样样样调调调调查查查查,如如如如:我我我我国国国国的的的的农农农农作作作作物物物物产产产产量量量量调调调调查查查查、职职职职工工工工家家家家计计计计调查等调查等调查等调查等 第19页,此课件共118页哦多阶段抽样多阶段抽样例:全国农作物产量抽样调查,首先由省所有县市级中例:全国农作物产量抽样调查,首先由省所有县市级中抽取部分县市作为第一阶段样本,再从被抽中的县抽取部分县市作为第一阶段样本,再从被抽中的县市中抽取乡镇作为第二阶段样本,从被抽中乡镇中市中抽取乡镇作为第二阶段样本,从被抽中乡镇中抽取村作为第三阶段样本,最后从中选村中抽取农抽取村作为第三阶段样本,最后从中选村中抽
17、取农户,并从农户的播种面积中抽取部分地块,进行实户,并从农户的播种面积中抽取部分地块,进行实割实测,计算平均亩产量,然后逐级往上综合计算割实测,计算平均亩产量,然后逐级往上综合计算平均亩产量,并推算全国总产量。平均亩产量,并推算全国总产量。第20页,此课件共118页哦多阶段抽样实例多阶段抽样实例 2005年全国年全国1%1%人口抽样调查是以全国为总体,人口抽样调查是以全国为总体,人口抽样调查是以全国为总体,人口抽样调查是以全国为总体,各省、自治区、直辖市为次总体,采用分层、多阶各省、自治区、直辖市为次总体,采用分层、多阶各省、自治区、直辖市为次总体,采用分层、多阶各省、自治区、直辖市为次总体,
18、采用分层、多阶段、整群概率比例抽样方法,在全国段、整群概率比例抽样方法,在全国段、整群概率比例抽样方法,在全国段、整群概率比例抽样方法,在全国3131个省、自治个省、自治个省、自治个省、自治区、直辖市抽取了区、直辖市抽取了区、直辖市抽取了区、直辖市抽取了2869个县个县个县个县(市、区市、区市、区市、区)、2118121181个乡个乡个乡个乡(镇、街道镇、街道镇、街道镇、街道)、77417个调查小区的个调查小区的个调查小区的个调查小区的16991699万人。万人。经加权后汇总,经加权后汇总,经加权后汇总,经加权后汇总,2005年全国人口出生率为年全国人口出生率为12.4012.40,死亡率为,
19、死亡率为,死亡率为,死亡率为6.516.51,自然增长率为,自然增长率为5.89。按此推算,。按此推算,。按此推算,。按此推算,20052005年末全国总人口为年末全国总人口为130756130756万人,万人,万人,万人,出生人口为出生人口为出生人口为出生人口为16171617万人,死亡人口为万人,死亡人口为万人,死亡人口为万人,死亡人口为849万人,净增万人,净增万人,净增万人,净增人口为人口为人口为人口为768万人万人万人万人。第21页,此课件共118页哦非概率抽样非概率抽样(non-probability sampling)1.相对于概率抽样而言相对于概率抽样而言2.抽抽取取样样本本时
20、时不不是是依依据据随随机机原原则则,而而是是根根据据研研究究目目的的对对数数据据的的要要求求,采采用用某某种种方方式式从从总体中抽出部分单位对其实施调查。总体中抽出部分单位对其实施调查。3.有有方方便便抽抽样样、判判断断抽抽样样、自自愿愿样样本本、滚滚雪雪球抽样、配额抽样等方式球抽样、配额抽样等方式。第22页,此课件共118页哦方便抽样方便抽样1.调调查查过过程程中中由由调调查查员员依依据据方方便便的的原原则则,自自行行确确定入选样本的单位。定入选样本的单位。n n调调调调查查查查员员员员在在在在街街街街头头头头、公公公公园园园园、商商商商店店店店等等等等公公公公共共共共场场场场所所所所进进进
21、进行行行行拦拦拦拦截截截截调查调查调查调查n n厂家在出售产品柜台前对路过顾客进行的调查厂家在出售产品柜台前对路过顾客进行的调查厂家在出售产品柜台前对路过顾客进行的调查厂家在出售产品柜台前对路过顾客进行的调查2.优点:优点:容易实施,调查的成本低容易实施,调查的成本低3.缺缺点点:样样本本单单位位的的确确定定带带有有随随意意性性,样样本本无无法法代代表有明确定义的总体,调查结果不宜推断总体表有明确定义的总体,调查结果不宜推断总体第23页,此课件共118页哦判断抽样判断抽样1.研研究究人人员员根根据据经经验验、判判断断和和对对研研究究对对象象的的了了解解,有有目的选择一些单位作为样本目的选择一些
22、单位作为样本n n有重点抽样,典型抽样,代表抽样等方式有重点抽样,典型抽样,代表抽样等方式有重点抽样,典型抽样,代表抽样等方式有重点抽样,典型抽样,代表抽样等方式2.判判断断抽抽样样是是主主观观的的,样样本本选选择择的的好好坏坏取取决决于于调调研者的判断、经验、专业程度和创造性研者的判断、经验、专业程度和创造性3.抽样成本比较低,容易操作抽样成本比较低,容易操作4.样样本本是是人人为为确确定定的的,没没有有依依据据随随机机的的原原则则,调调查结果不能用于推断总体查结果不能用于推断总体第24页,此课件共118页哦自愿样本自愿样本1.被被调调查查者者自自愿愿参参加加,成成为为样样本本中中的的一一分
23、分子子,向调查人员提供有关信息向调查人员提供有关信息n n例例如如,参参与与报报刊刊上上和和互互联联网网上上刊刊登登的的调调查查问问卷卷活活动动,向向某某类类节节目目拨拨打打热热线线电电话话等等,都都属属于自愿样本于自愿样本2.自愿样本自愿样本与抽样的随机性无关与抽样的随机性无关n n样本是有偏的样本是有偏的n n不能依据样本的信息推断总体不能依据样本的信息推断总体第25页,此课件共118页哦滚雪球抽样滚雪球抽样1.先先选选择择一一组组调调查查单单位位,对对其其实实施施调调查查之之后后,再再请请他他们们提提供供另另外外一一些些属属于于研研究究总总体体的的调调查查对对象象,调调查查人人员员根根据
24、据所所提提供供的的线线索索,进进行行此此后后的的调调查查。这这个个过过程程持续下去,就会形成滚雪球效应。持续下去,就会形成滚雪球效应。2.适合于对稀少群体和特定群体研究适合于对稀少群体和特定群体研究3.优优点点:容容易易找找到到那那些些属属于于特特定定群群体体的的被被调调查查者者,调查的成本也比较低。调查的成本也比较低。第26页,此课件共118页哦配额抽样配额抽样1.先先将将总总体体中中的的所所有有单单位位按按一一定定的的标标志志(变变量量)分分为为若若干干类类,然然后后在在每每个个类类中中采采用用方方便便抽抽样或判断抽样的方式选取样本单位。样或判断抽样的方式选取样本单位。2.操操作作简简单单
25、,可可以以保保证证样样本本的的结结构构和和总总体体的的结构类似。结构类似。3.抽抽取取具具体体样样本本单单位位时时,不不是是依依据据随随机机原原则则,属于非概率抽样属于非概率抽样。第27页,此课件共118页哦概率抽样与非概率抽样的比较概率抽样与非概率抽样的比较1.概率概率抽样抽样n n依据随机原则抽选样本依据随机原则抽选样本n n样本统计量的理论分布存在样本统计量的理论分布存在n n可根据调查的结果推断总体可根据调查的结果推断总体2.非概率非概率抽样抽样n n不是依据随机原则抽选样本不是依据随机原则抽选样本n n样本统计量的分布是不确定的样本统计量的分布是不确定的n n无法使用样本的结果推断总
26、体无法使用样本的结果推断总体第28页,此课件共118页哦三、抽样分布三、抽样分布第29页,此课件共118页哦1.总体中各元素的观察值所形成的分布总体中各元素的观察值所形成的分布 2.分布通常是未知的分布通常是未知的3.可以假定它服从某种分布可以假定它服从某种分布 总体分布总体分布(population distribution)总体总体第30页,此课件共118页哦1.一个样本中各观察值的分布一个样本中各观察值的分布 2.也称经验分布也称经验分布 3.当样本容量当样本容量n逐渐增大时,样本分布逐渐逐渐增大时,样本分布逐渐接近总体的分布接近总体的分布 样本分布样本分布(sample distrib
27、ution)样样本本第31页,此课件共118页哦1.样本统计量(如均值、比例、方差等)的样本统计量(如均值、比例、方差等)的概率分布,是一种理论概率分布概率分布,是一种理论概率分布2.随机变量是样本统计量随机变量是样本统计量n n样本均值样本均值,样本比例,样本方差等样本比例,样本方差等3.结果来自容量相同的所有可能样本结果来自容量相同的所有可能样本4.提供了样本统计量长远稳定的信息,是进提供了样本统计量长远稳定的信息,是进行推断的理论基础,也是抽样推断科学性行推断的理论基础,也是抽样推断科学性的重要依据的重要依据 抽样分布抽样分布 (sampling distribution)第32页,此课
28、件共118页哦抽样分布抽样分布 (sampling distribution)总体总体总体总体计算样本统计计算样本统计计算样本统计计算样本统计计算样本统计计算样本统计量量量量量量例如:样本均例如:样本均例如:样本均例如:样本均例如:样本均例如:样本均值、比例、方值、比例、方值、比例、方值、比例、方值、比例、方值、比例、方差差差差差差样样本本第33页,此课件共118页哦(一)样本均值的抽样分布(一)样本均值的抽样分布第34页,此课件共118页哦1.在重复选取容量为在重复选取容量为n的样本时,由样本均的样本时,由样本均值的所有可能取值形成的相对频数分布值的所有可能取值形成的相对频数分布2.一种理论
29、概率分布一种理论概率分布3.推断总体均值推断总体均值 的理论基础的理论基础样本均值的抽样分布样本均值的抽样分布第35页,此课件共118页哦样本均值的抽样分布样本均值的抽样分布(例题分析例题分析)【例例】设设设设一一一一个个个个总总总总体体体体,含含含含有有有有4个个个个元元元元素素素素(个个个个体体体体),即即即即总总总总体体体体单单单单位位位位数数数数N N=4。4 个个个个体体分分别别为为x1=1、x x2=2=2、x x3=3=3 、x x4=4。总总总总体体体体的均值、方差及分布如下的均值、方差及分布如下的均值、方差及分布如下的均值、方差及分布如下均值和方差均值和方差均值和方差均值和方
30、差总体分布总体分布1 14 42 23 30 0.1.1.2.2.3.3P P(X X)第36页,此课件共118页哦样本均值的抽样分布样本均值的抽样分布 (例题分析例题分析)从从从从总总总总体体体体中中中中抽抽抽抽取取取取n n2的的简简单单随随机机样样本本,在在重重复复抽抽样样条条件下,共有件下,共有42 2=16=16个样本。所有样本的结果为个样本。所有样本的结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第二个观察值第二个观察值第二个观察值第一个第一个第一个第一个观察值观察值观察值观察值所有可能的所有可能的
31、所有可能的所有可能的n n=2 =2 的样本(共的样本(共的样本(共的样本(共1616个)个)个)个)第37页,此课件共118页哦样本均值的抽样分布样本均值的抽样分布 (例题分析例题分析)计计算算出出各各样样本本的的均均值值,如如下下表表。并并给给出出样样本本均均值的抽样分布值的抽样分布3.53.53.03.02.52.52.02.03 33.03.02.52.52.02.01.51.52 24.04.03.53.53.03.02.52.54 42.52.54 42.02.03 32 21 11.51.51.01.01 1第二个观察值第二个观察值第二个观察值第二个观察值第一个第一个第一个第一个
32、观察值观察值观察值观察值1616个样本的均值(个样本的均值(个样本的均值(个样本的均值(x x)X X样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布1.01.00 0.1.1.2.2.3.3P P(X X)1.51.53.03.04.04.03.53.52.02.02.52.5第38页,此课件共118页哦样本均值抽样分布的特征值样本均值抽样分布的特征值(数学期望数学期望)设总体的均值是设总体的均值是,方差是,方差是2,从中抽取容量为从中抽取容量为n的的样本,则在重复抽样和不重复抽样条件下:样本,则在重复抽样和不重复抽样条件下:1.样本均值的数学期望样本均值的数学期望第
33、39页,此课件共118页哦样本均值的抽样分布样本均值的抽样分布(方差方差)2、样本均值的方差样本均值的方差n n重复抽样重复抽样n n不重复抽样不重复抽样不重复抽样不重复抽样当抽样比当抽样比n 时,时,时,时,修正系数修正系数修正系数修正系数可以忽略不计。可以忽略不计。第40页,此课件共118页哦所有样本均值的均值和方差所有样本均值的均值和方差式中:式中:式中:式中:为样本数目,为样本数目,为样本数目,为样本数目,n n为样本容量。为样本容量。为样本容量。为样本容量。比较及结论:比较及结论:比较及结论:比较及结论:1.1.样本均值的均值(数学期望)等于总体均值样本均值的均值(数学期望)等于总体
34、均值样本均值的均值(数学期望)等于总体均值样本均值的均值(数学期望)等于总体均值 2.2.样本均值的方差等于总体方差的样本均值的方差等于总体方差的样本均值的方差等于总体方差的样本均值的方差等于总体方差的1/1/n n第41页,此课件共118页哦样本均值的分布与总体分布的比较样本均值的分布与总体分布的比较 (例题分析例题分析)=2.5 2=1.25总体分布总体分布1 14 42 23 30 0.1.1.2.2.3.3抽样分布抽样分布P P(X X)1.01.00 0.1.1.2.2.3.31.51.53.03.04.04.03.53.52.02.02.52.5X XP P(X X)第42页,此课
35、件共118页哦样本均值的抽样分布样本均值的抽样分布(总体是正态分布)(总体是正态分布)=50=50=50 =10=10=10X X X总体分布总体分布总体分布总体分布n=4抽样分布抽样分布抽样分布抽样分布Xn=16当当当当总总总总体体体体服服服服从从从从正正正正态态态态分分分分布布布布N N(,2 2)时时,来来自自该该总总体体的的所所有有容容量量为为n的的样样本本的的均均值值 X也也服服从从正正态态分分布布,X X 的的数数学学期期望望为为,方差为,方差为,方差为,方差为2/n n。即。即 X XN(,2 2/n n)第43页,此课件共118页哦中心极限定理中心极限定理(central li
36、mit theorem)中中中中心心心心极极极极限限限限定定定定理理理理:设设设设从从从从均均均均值值值值为为为为 ,方方方方差差差差为为为为 2 2的的的的一一一一个个个个任任任任意意意意总总总总体体体体中中中中抽抽抽抽取取取取容容容容量量量量为为为为n n的的的的样样样样本本本本,当当当当n n充充充充分分分分大大大大时时时时,样样样样本本本本均均均均值值值值的的的的抽抽抽抽样样样样分分分分布布布布近近近近似似似似服从均值为服从均值为服从均值为服从均值为、方差为、方差为、方差为、方差为 2 2/n n的正态分布的正态分布的正态分布的正态分布当样本容量足够当样本容量足够当样本容量足够当样本容
37、量足够大时大时大时大时(n n 30)30),样本均值的抽样样本均值的抽样样本均值的抽样样本均值的抽样分布逐渐趋于正分布逐渐趋于正分布逐渐趋于正分布逐渐趋于正态分布态分布态分布态分布一个任意分一个任意分一个任意分一个任意分布的总体布的总体布的总体布的总体第44页,此课件共118页哦中心极限定理中心极限定理 (central limit theorem)的分的分布趋布趋于正于正态分态分布的布的过程过程第45页,此课件共118页哦抽样分布与总体分布的关系抽样分布与总体分布的关系总体分布总体分布正态分布正态分布非正态分布非正态分布大样本大样本小样本小样本正态分布正态分布正态分布正态分布非正态分布非正
38、态分布第46页,此课件共118页哦(二)样本比例的抽样分布(二)样本比例的抽样分布第47页,此课件共118页哦比例比例(proportion)1.总体总体(或样本或样本)中具有某种属性的单位与全部单中具有某种属性的单位与全部单位总数之比位总数之比n n合格品合格品合格品合格品(或不合格品或不合格品或不合格品或不合格品)与全部产品总数之比与全部产品总数之比与全部产品总数之比与全部产品总数之比2.总体比例可表示为总体比例可表示为3.样本比例可表示为样本比例可表示为 第48页,此课件共118页哦1.在重复选取容量为在重复选取容量为n的样本时,由样本比的样本时,由样本比例的所有可能取值形成的相对频数分
39、布例的所有可能取值形成的相对频数分布2.当样本容量很大时(当样本容量很大时(np5或或n(1-p)5n(1-p)5),样),样本比例的抽样分布可用正态分布近似本比例的抽样分布可用正态分布近似 3.一种理论概率分布一种理论概率分布4.推断总体比例推断总体比例 的理论基础的理论基础样本比例的抽样分布样本比例的抽样分布第49页,此课件共118页哦样本比例的抽样分布样本比例的抽样分布(数学期望与方差数学期望与方差)1.1.样本比例的数学期望样本比例的数学期望样本比例的数学期望样本比例的数学期望2.2.样本比例的方差样本比例的方差样本比例的方差样本比例的方差n n重复抽样重复抽样重复抽样重复抽样n n不
40、重复抽样不重复抽样不重复抽样不重复抽样当抽样比当抽样比当抽样比当抽样比n/N5%n/N5%时,修正系数时,修正系数时,修正系数时,修正系数第50页,此课件共118页哦四、抽样推断中常用的四、抽样推断中常用的统计量及其分布统计量及其分布第51页,此课件共118页哦(一)一)Z Z统计量及其分布统计量及其分布第52页,此课件共118页哦标准正态分布标准正态分布设设随随机机变变量量 X N(,2),n个个随随机机变变量量X1,X2,Xn为为X的一个简单随机样本,则样本均值的一个简单随机样本,则样本均值 N(,2/n),将将其其标标准准化化,得得到到Z统统计计量量及及其其分分布:布:第53页,此课件共
41、118页哦标准正态分布标准正态分布1.标标准准正正态态分分布布是是均均值值=0,标标准准差差=1的的正正态态分布。分布。2.标标准准正正态态分分布布的的横横轴轴以以Z值值为为刻刻度度,Z值值度量的是一个点距离均值多少倍标准差。度量的是一个点距离均值多少倍标准差。3.大大于于均均值值的的数数据据点点,其其Z值值为为正正,小小于于均均值的数据点,其值的数据点,其Z值为负。值为负。第54页,此课件共118页哦标准正态分布标准正态分布x 一般正态分布一般正态分布一般正态分布一般正态分布一般正态分布一般正态分布 11Z标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布 第55页,此
42、课件共118页哦标准化的例子标准化的例子 P P(5(5 X X 6.2)6.2)x 55 11一般正态分布一般正态分布一般正态分布一般正态分布一般正态分布一般正态分布6.2 11Z标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布 0.120.04780.04780.0478第56页,此课件共118页哦(二)(二)t t 统计量及其分布统计量及其分布第57页,此课件共118页哦t 分布分布1.高高 塞塞 特特(W.S.Gosset)于于 1908年年 在在 一一 篇篇 以以“Student”(学生学生)为笔名的论文中首次提出为笔名的论文中首次提出2.t 分布是小样本分布
43、,一般指分布是小样本分布,一般指n30。3.t 分分布布适适用用于于当当总总体体标标准准差差未未知知,用用样样本本标标准准差差代代替替总总体体标标准准差差,由由样样本本平平均均数数推推断断总总体体平平均均数数以以及及两两个个样样本本之之间间差差异异的的显显著著性性检检验验等。等。第58页,此课件共118页哦t 统计量的分布统计量的分布 设设设设随随随随机机机机变变变变量量量量X X N N(,2 2),n n个个个个随随随随机机机机变变变变量量量量X X1 1,X X2,Xn n为为X X的一个简单随机样本,的一个简单随机样本,的一个简单随机样本,的一个简单随机样本,称称称称为统计量为统计量为
44、统计量为统计量,它服从自由度为它服从自由度为它服从自由度为它服从自由度为(n n-1)-1)的的的的t t 分布分布分布分布X X Xt t 分布与标准正态分布的比较分布与标准正态分布的比较t t 分布分布标准正态分标准正态分布布t不同自由度的不同自由度的t t分布分布标准正态分布标准正态分布t t(dfdf=13)=13)t t(dfdf=5)=5)Z Z第59页,此课件共118页哦t 分布的性质分布的性质1、t 分布的均值为分布的均值为分布的均值为分布的均值为0 02、t 分布是一个均值对称的分布分布是一个均值对称的分布分布是一个均值对称的分布分布是一个均值对称的分布3 3、取值范围在取值
45、范围在-与与之间,之间,曲线以曲线以曲线以曲线以 x 轴为渐进线轴为渐进线轴为渐进线轴为渐进线4、t 分布方差大于分布方差大于分布方差大于分布方差大于1,与标准正态分布比,与标准正态分布比,与标准正态分布比,与标准正态分布比,t 分布中心略低,分布中心略低,分布中心略低,分布中心略低,两尾部较高,自由度越小,差别越明显。两尾部较高,自由度越小,差别越明显。两尾部较高,自由度越小,差别越明显。两尾部较高,自由度越小,差别越明显。5、随着样本容量(自由度、随着样本容量(自由度、随着样本容量(自由度、随着样本容量(自由度n-1)不断增大,)不断增大,)不断增大,)不断增大,t 分布越来越趋分布越来越
46、趋分布越来越趋分布越来越趋近于标准正态分布,并以标准正态分布为极限。近于标准正态分布,并以标准正态分布为极限。近于标准正态分布,并以标准正态分布为极限。近于标准正态分布,并以标准正态分布为极限。第60页,此课件共118页哦(三)(三)2 2统计量及其分布统计量及其分布第61页,此课件共118页哦 2分布分布(2 distribution)2分布是由阿贝分布是由阿贝(Abbe)于于1863年首先提出,年首先提出,后来由海尔墨特后来由海尔墨特(Hermert)和卡尔和卡尔皮尔皮尔逊逊(KPearson)分别于分别于1875年和年和1900年年推导出来的。推导出来的。主要适用于:总体方差的估计和检验
47、、对主要适用于:总体方差的估计和检验、对拟合优度检验和独立性检验等。拟合优度检验和独立性检验等。第62页,此课件共118页哦 2分布分布(2 distribution)1.设设随随机机变变量量X1,X2,Xn相相互互独独立立,且且服服从从标标准准正正态态分分布布 ,则则它它们们的的平平方方和和X2服从自由度为服从自由度为n的的 2分布。分布。2.令令 ,则,则 Y 服从自由度为服从自由度为1的的 2分布,即分布,即 3.当总体当总体 ,从中抽取容量为,从中抽取容量为n的样本,则的样本,则第63页,此课件共118页哦1.1.分布的变量值始终为正分布的变量值始终为正分布的变量值始终为正分布的变量值
48、始终为正 2.2.分分分分布布布布的的的的形形形形状状状状取取取取决决决决于于于于其其其其自自自自由由由由度度度度n n的的大大小小,通通常常为为不不对对称称的正偏分布,但随着自由度的增大逐渐趋于对称的正偏分布,但随着自由度的增大逐渐趋于对称 3.期望为:期望为:E(E(2)=)=n n,方差为:,方差为:D(D(2 2)=2)=2n n(n为自由度为自由度)4.可可加加性性:若若X X和和Y Y为为两两个个独独立立的的 2 2分分分分布布布布随随随随机机机机变变变变量量量量,X X 2(n(n1 1),Y 2 2(n2 2),),则则则则X X+Y Y这这这这一一一一随随随随机机机机变变变变
49、量量量量服服服服从从从从自自自自由由由由度度度度为为为为n1 1+n2的的 2 2分布分布 2分布分布(性质和特点性质和特点)第64页,此课件共118页哦卡方卡方 (c c2 2)分布分布 选择容量为选择容量为n 的的简单随机样本简单随机样本计算样本方差计算样本方差S2计算卡方值计算卡方值 2=(n-1)S2/2计算出所有的计算出所有的 2值值不同容量样本的抽样分布不同容量样本的抽样分布不同容量样本的抽样分布不同容量样本的抽样分布c c c c c c2 2 2 22 2n n=1=1n n=4=4n n=10=10n n=20=20 总体总体第65页,此课件共118页哦(四)(四)F F 统
50、计量及其分布统计量及其分布第66页,此课件共118页哦F分布分布(F distribution)1.由统计学家费舍由统计学家费舍(R.A.Fisher)提出的提出的2.适用于方差分析、协方差分析和回归分析等。适用于方差分析、协方差分析和回归分析等。3.设设若若X为为服服从从自自由由度度为为n的的 2分分布布,即即X 2(n),Y为为服服从从自自由由度度为为m的的 2分分布布,即即Y 2(m),且且X和和Y相互独立,则相互独立,则F统计量及其分布为:统计量及其分布为:称称F为服从自由度为服从自由度n和和m的的F分布。分布。第67页,此课件共118页哦1.如果如果如果如果XF(n,m),XF(n,