《统计学的教材.pptx》由会员分享,可在线阅读,更多相关《统计学的教材.pptx(69页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、会计学1统计学的教材统计学的教材2抽样估计抽样估计抽样估计抽样估计n n是利用抽样调查所获得的样本信息,根据概率是利用抽样调查所获得的样本信息,根据概率是利用抽样调查所获得的样本信息,根据概率是利用抽样调查所获得的样本信息,根据概率论所揭示的随机变量的一般规律性,对总体的论所揭示的随机变量的一般规律性,对总体的论所揭示的随机变量的一般规律性,对总体的论所揭示的随机变量的一般规律性,对总体的某些数量特征进行估计。某些数量特征进行估计。某些数量特征进行估计。某些数量特征进行估计。n n是推断统计学的一个重要组成部分。是推断统计学的一个重要组成部分。是推断统计学的一个重要组成部分。是推断统计学的一个
2、重要组成部分。n n本章内容也是后面的假设检验、相关回归分析本章内容也是后面的假设检验、相关回归分析本章内容也是后面的假设检验、相关回归分析本章内容也是后面的假设检验、相关回归分析的重要基础。的重要基础。的重要基础。的重要基础。n n注:本章所讲的抽样指随机抽样(概率抽样)注:本章所讲的抽样指随机抽样(概率抽样)注:本章所讲的抽样指随机抽样(概率抽样)注:本章所讲的抽样指随机抽样(概率抽样)本章在统计学中的地位本章在统计学中的地位本章在统计学中的地位本章在统计学中的地位第1页/共69页3一、抽样估计的意义和一般步骤一、抽样估计的意义和一般步骤一、抽样估计的意义和一般步骤一、抽样估计的意义和一般
3、步骤(一)抽样估计的意义(一)抽样估计的意义n n抽样估计首先要获取样本数据,抽样估计首先要获取样本数据,在调查阶段称之为抽样调查。在调查阶段称之为抽样调查。n n 与全面调查比较,它省时省力与全面调查比较,它省时省力与全面调查比较,它省时省力与全面调查比较,它省时省力且调查内容可以更深入细致;且调查内容可以更深入细致;且调查内容可以更深入细致;且调查内容可以更深入细致;n n与非全面调查比较,它主要具有与非全面调查比较,它主要具有与非全面调查比较,它主要具有与非全面调查比较,它主要具有三个特点。三个特点。三个特点。三个特点。n n抽样调查的应用范围十分广泛抽样调查的应用范围十分广泛常常在不可
4、能、不必要、来不及进行全面调常常在不可能、不必要、来不及进行全面调常常在不可能、不必要、来不及进行全面调常常在不可能、不必要、来不及进行全面调查或为了补充和验证全面调查结果时采用抽样查或为了补充和验证全面调查结果时采用抽样查或为了补充和验证全面调查结果时采用抽样查或为了补充和验证全面调查结果时采用抽样调查。调查。调查。调查。抽样方案的设计抽样方案的设计第2页/共69页4(二)抽样估计的一般步骤(二)抽样估计的一般步骤1、设计抽样方案、设计抽样方案2、随机抽取样本随机抽取样本(从总体随机抽取部分单位构(从总体随机抽取部分单位构(从总体随机抽取部分单位构(从总体随机抽取部分单位构成样本)成样本)成
5、样本)成样本)3、搜集样本资料、搜集样本资料(对样本单位进行调查登记)(对样本单位进行调查登记)(对样本单位进行调查登记)(对样本单位进行调查登记)4、整理样本资料、整理样本资料(审查、分组汇总、计算样本(审查、分组汇总、计算样本(审查、分组汇总、计算样本(审查、分组汇总、计算样本指标的数值,即计算估计量的具体数值)指标的数值,即计算估计量的具体数值)指标的数值,即计算估计量的具体数值)指标的数值,即计算估计量的具体数值)5、估计总体指标、估计总体指标(即估计总体参数)(即估计总体参数)(即估计总体参数)(即估计总体参数)总总体体参参数数与与样样本本估估计计量量的的关关系系对对于于特特定定的的
6、目目的的,总总体体是是惟惟一一的的,所所以以参参数数也也是是惟惟一一的的;而而由由于样本是随机的,所以样本估计量是随机变量。于样本是随机的,所以样本估计量是随机变量。第3页/共69页5总体参数总体参数样本估计量及其计算公式样本估计量及其计算公式总体平均数样本平均数总体成数P样本成数p=n1/n总体方差样本方差(若分母为n-1则称之为样本修正方差)总体标准差样本标准差(若分母为n-1则称之为样本修正方差)第4页/共69页6二、抽样方案二、抽样方案(一)(一)抽样方案设计的基本准则抽样方案设计的基本准则1、随机原则、随机原则 2、抽样误差最小、抽样误差最小 3、费用最少、费用最少第5页/共69页7
7、 (二)抽样方案设计的主要内容(二)抽样方案设计的主要内容(二)抽样方案设计的主要内容(二)抽样方案设计的主要内容 除了一般调查方案的内容外,除了一般调查方案的内容外,主要还包括主要还包括:n n编制抽样框编制抽样框编制抽样框编制抽样框n n确定抽样方法确定抽样方法确定抽样方法确定抽样方法n n确定抽样组织方式确定抽样组织方式确定抽样组织方式确定抽样组织方式n n确定抽样数目确定抽样数目确定抽样数目确定抽样数目 第6页/共69页8什么是抽样框?什么是抽样框?什么是抽样框?什么是抽样框?包括全部抽样单位的框架。包括全部抽样单位的框架。包括全部抽样单位的框架。包括全部抽样单位的框架。抽样框的意义抽
8、样框的意义抽样框的意义抽样框的意义实施抽样的基础,影响抽样的随机实施抽样的基础,影响抽样的随机实施抽样的基础,影响抽样的随机实施抽样的基础,影响抽样的随机性和抽样效果。性和抽样效果。性和抽样效果。性和抽样效果。抽样框的主要形式抽样框的主要形式抽样框的主要形式抽样框的主要形式(1 1)名单抽样框)名单抽样框)名单抽样框)名单抽样框 (2 2)区域抽样框)区域抽样框)区域抽样框)区域抽样框 (3 3)时间表抽样框)时间表抽样框)时间表抽样框)时间表抽样框 抽样框的要求抽样框的要求抽样框的要求抽样框的要求 一个理想的抽样框应该与目标总体一个理想的抽样框应该与目标总体一个理想的抽样框应该与目标总体一个
9、理想的抽样框应该与目标总体一致,即应包括全部总体单位,既不重复也不遗漏;一致,即应包括全部总体单位,既不重复也不遗漏;一致,即应包括全部总体单位,既不重复也不遗漏;一致,即应包括全部总体单位,既不重复也不遗漏;尽可能利用与所研究变量相关的辅助变量的信息。尽可能利用与所研究变量相关的辅助变量的信息。尽可能利用与所研究变量相关的辅助变量的信息。尽可能利用与所研究变量相关的辅助变量的信息。1、编制抽样、编制抽样框框第7页/共69页92 2、确定抽样方法、确定抽样方法、确定抽样方法、确定抽样方法重复抽样和不重复抽样重复抽样和不重复抽样重复抽样和不重复抽样重复抽样和不重复抽样n n重复抽样,也叫回置抽样
10、重复抽样,也叫回置抽样重复抽样,也叫回置抽样重复抽样,也叫回置抽样,是指从总体的个单位中抽取,是指从总体的个单位中抽取,是指从总体的个单位中抽取,是指从总体的个单位中抽取一个容量为一个容量为一个容量为一个容量为n n的样本,每次抽出一个单位后,再将其放回总的样本,每次抽出一个单位后,再将其放回总的样本,每次抽出一个单位后,再将其放回总的样本,每次抽出一个单位后,再将其放回总体中参加下一次抽取,这样连续抽体中参加下一次抽取,这样连续抽体中参加下一次抽取,这样连续抽体中参加下一次抽取,这样连续抽n n次即得到一个样本。次即得到一个样本。次即得到一个样本。次即得到一个样本。n n 同一总体单位有可能
11、被重复抽中;同一总体单位有可能被重复抽中;同一总体单位有可能被重复抽中;同一总体单位有可能被重复抽中;n n 每次都是从个总体单位中抽取;每次都是从个总体单位中抽取;每次都是从个总体单位中抽取;每次都是从个总体单位中抽取;n n 次抽取就是次相互独立的随机试验。次抽取就是次相互独立的随机试验。次抽取就是次相互独立的随机试验。次抽取就是次相互独立的随机试验。n n不重复抽样,也叫不回置抽样,不重复抽样,也叫不回置抽样,不重复抽样,也叫不回置抽样,不重复抽样,也叫不回置抽样,是指抽中单位不再放回总是指抽中单位不再放回总是指抽中单位不再放回总是指抽中单位不再放回总体中,下一个样本单位只能从余下的总体
12、单位中抽取。体中,下一个样本单位只能从余下的总体单位中抽取。体中,下一个样本单位只能从余下的总体单位中抽取。体中,下一个样本单位只能从余下的总体单位中抽取。n n 同一总体单位不可能被重复抽中同一总体单位不可能被重复抽中同一总体单位不可能被重复抽中同一总体单位不可能被重复抽中.n n 每次抽取是在不同数目的总体单位中进行的每次抽取是在不同数目的总体单位中进行的每次抽取是在不同数目的总体单位中进行的每次抽取是在不同数目的总体单位中进行的n n 次抽取可看作是次互不独立的随机试验。次抽取可看作是次互不独立的随机试验。次抽取可看作是次互不独立的随机试验。次抽取可看作是次互不独立的随机试验。第8页/共
13、69页10基本的抽样组织方式有四种:基本的抽样组织方式有四种:基本的抽样组织方式有四种:基本的抽样组织方式有四种:n n简单随机抽样(纯随机抽样)简单随机抽样(纯随机抽样)简单随机抽样(纯随机抽样)简单随机抽样(纯随机抽样)n n分层抽样(类型抽样)分层抽样(类型抽样)分层抽样(类型抽样)分层抽样(类型抽样)n n等距抽样(机械抽样、系统抽样)等距抽样(机械抽样、系统抽样)等距抽样(机械抽样、系统抽样)等距抽样(机械抽样、系统抽样)n n整群抽样(集团抽样)整群抽样(集团抽样)整群抽样(集团抽样)整群抽样(集团抽样)(参见第四节)(参见第四节)(参见第四节)(参见第四节)3 3、确定抽样组织方
14、式、确定抽样组织方式、确定抽样组织方式、确定抽样组织方式第9页/共69页11大样本大样本大样本大样本 n=n=30 30 小样本小样本小样本小样本 nn3030 对经济现象抽样调查常采用大样本。对经济现象抽样调查常采用大样本。对经济现象抽样调查常采用大样本。对经济现象抽样调查常采用大样本。抽样数目往往根据误差要求来确定,其计抽样数目往往根据误差要求来确定,其计抽样数目往往根据误差要求来确定,其计抽样数目往往根据误差要求来确定,其计算见第三节。算见第三节。算见第三节。算见第三节。4、确定抽样数目、确定抽样数目第10页/共69页12第二节第二节第二节第二节 简单随机抽样的抽样误差测定简单随机抽样的
15、抽样误差测定简单随机抽样的抽样误差测定简单随机抽样的抽样误差测定一、一、一、一、抽样误差的概念抽样误差的概念抽样误差的概念抽样误差的概念 统计调查中的误差种类:统计调查中的误差种类:统计调查中的误差种类:统计调查中的误差种类:n n登记性误差,登记性误差,登记性误差,登记性误差,可能存在于任何统计调查中可能存在于任何统计调查中可能存在于任何统计调查中可能存在于任何统计调查中n n代表性误差,代表性误差,代表性误差,代表性误差,存在于非全面统计调查中存在于非全面统计调查中存在于非全面统计调查中存在于非全面统计调查中n n系统误差系统误差系统误差系统误差 ,存在于非随机抽样调存在于非随机抽样调存在
16、于非随机抽样调存在于非随机抽样调查中查中查中查中n n 随机误差随机误差随机误差随机误差 ,存在于抽样调查中存在于抽样调查中存在于抽样调查中存在于抽样调查中第11页/共69页13抽样误差抽样误差抽样误差抽样误差是指由于抽样的随机性而产生的样本指标与总是指由于抽样的随机性而产生的样本指标与总是指由于抽样的随机性而产生的样本指标与总是指由于抽样的随机性而产生的样本指标与总体指标之间的代表性误差。在抽样调查中登记性误差体指标之间的代表性误差。在抽样调查中登记性误差体指标之间的代表性误差。在抽样调查中登记性误差体指标之间的代表性误差。在抽样调查中登记性误差和系统误差可以避免,而抽样误差则是不可以避免的
17、,和系统误差可以避免,而抽样误差则是不可以避免的,和系统误差可以避免,而抽样误差则是不可以避免的,和系统误差可以避免,而抽样误差则是不可以避免的,但可以事先估计并加以控制。在计算抽样误差时常常但可以事先估计并加以控制。在计算抽样误差时常常但可以事先估计并加以控制。在计算抽样误差时常常但可以事先估计并加以控制。在计算抽样误差时常常假设不存在登记性误差和系统误差。假设不存在登记性误差和系统误差。假设不存在登记性误差和系统误差。假设不存在登记性误差和系统误差。由于总体参数未知,对每一个具体样本,其实际抽样误由于总体参数未知,对每一个具体样本,其实际抽样误由于总体参数未知,对每一个具体样本,其实际抽样
18、误由于总体参数未知,对每一个具体样本,其实际抽样误差是无法计算的。只能从所有可能样本的角度,根据差是无法计算的。只能从所有可能样本的角度,根据差是无法计算的。只能从所有可能样本的角度,根据差是无法计算的。只能从所有可能样本的角度,根据样本估计量的抽样分布来计算其抽样的平均误差程度。样本估计量的抽样分布来计算其抽样的平均误差程度。样本估计量的抽样分布来计算其抽样的平均误差程度。样本估计量的抽样分布来计算其抽样的平均误差程度。一、一、抽样误差的概念抽样误差的概念第12页/共69页14例(抽样与抽样误差)例(抽样与抽样误差)设设一一个个总总体体,含含有有4 4个个个个体体,即即总总体体单单位位数数N
19、 N=4=4。这这44个个体分别为个个体分别为X X1 1=22=22、X X2 2=24=24、X X3 3=26=26、X X4 4=28=28。可计算出该总体的均值为可计算出该总体的均值为2525、方差为、方差为5 5。现从该总体中抽取现从该总体中抽取n n2 2的简单随机样本,的简单随机样本,在重复抽样条件下,共可能抽取在重复抽样条件下,共可能抽取4 42 2=16=16个个样本。所有样本的结果见表样本。所有样本的结果见表4-24-2。第13页/共69页15几个直观的结论几个直观的结论几个直观的结论几个直观的结论1.1.样本均值的均值(数学期望)等于总体均值(式中:样本均值的均值(数学
20、期望)等于总体均值(式中:MM为样本为样本数目);数目);2.2.抽样误差是随样本不同而不同的随机变量。抽样误差均值抽样误差是随样本不同而不同的随机变量。抽样误差均值等于等于0 0;3.3.样本均值的方差等于总体方差的样本均值的方差等于总体方差的1/1/n n。第14页/共69页161.1.样本估计量是随机变量,其概样本估计量是随机变量,其概率分布称为抽样分布。率分布称为抽样分布。2.2.是一种理论概率分布。是一种理论概率分布。3.3.样本估计量的抽样分布主要取样本估计量的抽样分布主要取决于:决于:总体的分布;样本容量;估计量总体的分布;样本容量;估计量总体的分布;样本容量;估计量总体的分布;
21、样本容量;估计量的构造(公式);抽样方法和的构造(公式);抽样方法和的构造(公式);抽样方法和的构造(公式);抽样方法和组织形式。组织形式。组织形式。组织形式。抽样分布抽样分布第15页/共69页17将将所所有有可可能能样样本本的的均均值值整整理理,即即可可得得到到该该例例中中样样本本均均值值的的抽抽样分布。样分布。样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布图图图图2 22 2.1.1.2 2.3.3P P(x x)2 23 32 26 62 28 82 27 72 24 42 25 5x x样本均值概率221/16232/16243/16254/16263/162
22、72/16281/16合计10样本均值的抽样分布样本均值的抽样分布第16页/共69页18样本均值的抽样分布定理样本均值的抽样分布定理 当当当当总总总总体体体体服服服服从从从从正正正正态态态态分分分分布布布布N N (,2 2)时时时时,来来来来自自自自该该该该总总总总体体体体的的的的所所所所有有有有容容容容量量量量为为为为n n的的的的样样样样本本本本的的的的均均均均值值值值 也也也也服服服服从从从从正正正正态态态态分分分分布布布布,的数学期望为的数学期望为的数学期望为的数学期望为,方差为,方差为,方差为,方差为 2 2/n n。即:。即:。即:。即:N N(,2 2/n n)。中中心心极极限
23、限定定理理:设设设设从从从从均均均均值值值值为为为为,方方方方差差差差为为为为 2 2的的的的一一一一个个个个任任任任意意意意总总总总体体体体中中中中抽抽抽抽取取取取容容容容量量量量为为为为n n的的的的样样样样本本本本,当当当当n n充充充充分分分分大大大大时时时时,样样样样本本本本均均均均值值值值的的的的抽抽抽抽样样样样分分分分布布布布近近近近似似似似 服服服服从从从从均均均均值值值值为为为为、方方方方差差差差为为为为 2 2/n n的的的的正正正正态态态态分布。分布。分布。分布。第17页/共69页19二、抽样平均误差二、抽样平均误差(一)(一)(一)(一)抽样平均误差的定义抽样平均误差的
24、定义抽样平均误差的定义抽样平均误差的定义 n n抽样平均误差指样本估计量抽样平均误差指样本估计量的标准差。的标准差。n n均值的抽样平均误差常常记为均值的抽样平均误差常常记为均值的抽样平均误差常常记为均值的抽样平均误差常常记为n n比率的抽样平均误差常常记为比率的抽样平均误差常常记为比率的抽样平均误差常常记为比率的抽样平均误差常常记为n n它反映所有可能样本估计值它反映所有可能样本估计值与中心(相应总体参数)的与中心(相应总体参数)的平均差异平均差异程度,衡量样本对程度,衡量样本对总体的代表性大小。总体的代表性大小。n n抽样平均误差的平方称为抽样平均误差的平方称为“抽样方差抽样方差”。第18
25、页/共69页20 重复抽样下:重复抽样下:重复抽样下:重复抽样下:不重复抽样下:不重复抽样下:不重复抽样下:不重复抽样下:(二)抽样平均误差的计算公式(二)抽样平均误差的计算公式(二)抽样平均误差的计算公式(二)抽样平均误差的计算公式第19页/共69页21(1 1)总总总总体体体体方方方方差差差差(或或或或总总总总体体体体标标标标准准准准差差差差)。其其其其它它它它条条条条件件件件不不不不变变变变的的的的条条条条件下,总体单位的差异程度大,抽样平均误差大。件下,总体单位的差异程度大,抽样平均误差大。件下,总体单位的差异程度大,抽样平均误差大。件下,总体单位的差异程度大,抽样平均误差大。(2 2
26、)抽抽抽抽样样样样数数数数目目目目。其其其其它它它它条条条条件件件件不不不不变变变变的的的的条条条条件件件件下下下下,抽抽抽抽样样样样数数数数目目目目多多多多,抽样平均误差小抽样平均误差小抽样平均误差小抽样平均误差小(3 3)抽抽抽抽样样样样方方方方法法法法。相相相相同同同同条条条条件件件件下下下下,重重重重复复复复抽抽抽抽样样样样的的的的抽抽抽抽样样样样平平平平均均均均误误误误差大比不重复抽样的抽样平均误差大。差大比不重复抽样的抽样平均误差大。差大比不重复抽样的抽样平均误差大。差大比不重复抽样的抽样平均误差大。(4 4)抽样组织方式。由于不同抽样组织方式有不同的)抽样组织方式。由于不同抽样组
27、织方式有不同的)抽样组织方式。由于不同抽样组织方式有不同的)抽样组织方式。由于不同抽样组织方式有不同的抽样误差,所以,在误差要求相同的情况下,不同抽样误差,所以,在误差要求相同的情况下,不同抽样误差,所以,在误差要求相同的情况下,不同抽样误差,所以,在误差要求相同的情况下,不同抽样组织方式所必需的抽样数目也不同。抽样组织方式所必需的抽样数目也不同。抽样组织方式所必需的抽样数目也不同。抽样组织方式所必需的抽样数目也不同。(三)影响抽样平均误差的因素(三)影响抽样平均误差的因素(三)影响抽样平均误差的因素(三)影响抽样平均误差的因素第20页/共69页22 不知道总体方差时如何计算不知道总体方差时如
28、何计算不知道总体方差时如何计算不知道总体方差时如何计算 n n 用样本方差代替计算用样本方差代替计算n n 用过去(总体或样本)方差代用过去(总体或样本)方差代替计算替计算n n 用同类现象(当前用同类现象(当前 或过去、总或过去、总体或样本)体或样本)方方 代替计算代替计算n n 有若干个方差可选择时,选方有若干个方差可选择时,选方差最大者差最大者 (注意:对比率,即选择最接(注意:对比率,即选择最接近近0.5的值所得的方差最大)的值所得的方差最大)第21页/共69页23三三 抽样极限误差抽样极限误差(一)抽样极限误差的概念(一)抽样极限误差的概念(一)抽样极限误差的概念(一)抽样极限误差的
29、概念 抽抽样样极极限限误误差差是是指指一一定定概概率率下下抽抽样样误误差差的的可可能能范范围围,也也称称为为允允许许误误差差。用用表表示示抽抽样样极极限限误误差差,则则这这一一概概念念可可以以表表述为如下不等式:述为如下不等式:第22页/共69页24 与抽样极限误差相关的两个概念:与抽样极限误差相关的两个概念:与抽样极限误差相关的两个概念:与抽样极限误差相关的两个概念:n n抽抽样样误误差差率率(抽抽样样极极限限误误差差估计量)估计量)n n抽抽样样估估计计精精度度100%抽抽样样误误差差率率 抽样估计时,我们总是希望估计的误差尽可能小抽样估计时,我们总是希望估计的误差尽可能小抽样估计时,我们
30、总是希望估计的误差尽可能小抽样估计时,我们总是希望估计的误差尽可能小(即估计精度尽可能高)并且估计的置信度也尽可能大。(即估计精度尽可能高)并且估计的置信度也尽可能大。(即估计精度尽可能高)并且估计的置信度也尽可能大。(即估计精度尽可能高)并且估计的置信度也尽可能大。但事实上这两者往往是相矛盾的。在其它条件不变的情况但事实上这两者往往是相矛盾的。在其它条件不变的情况但事实上这两者往往是相矛盾的。在其它条件不变的情况但事实上这两者往往是相矛盾的。在其它条件不变的情况下,提高估计的置信度,会增大允许误差(使估计精度降下,提高估计的置信度,会增大允许误差(使估计精度降下,提高估计的置信度,会增大允许
31、误差(使估计精度降下,提高估计的置信度,会增大允许误差(使估计精度降低);缩小允许误差(提高估计的精度),则会降低估计低);缩小允许误差(提高估计的精度),则会降低估计低);缩小允许误差(提高估计的精度),则会降低估计低);缩小允许误差(提高估计的精度),则会降低估计的置信度。的置信度。的置信度。的置信度。第23页/共69页25(二)(二)(二)(二)大样条件下的抽样极限误差大样条件下的抽样极限误差大样条件下的抽样极限误差大样条件下的抽样极限误差 根据样本均值的抽样分布定理,所以,有:给定估计的概率(1-),查标准正态分布表得对应的临界点Z/2后,抽样极限误差的计算公式为:同理,可得比率的抽样
32、极限误差公式为:第24页/共69页26(三)(三)(三)(三)小样条件下的抽样极限误差小样条件下的抽样极限误差小样条件下的抽样极限误差小样条件下的抽样极限误差 根据样本均值的抽样分布定理:小样本下,若总体方差已知,且总体服从正态分布,则:所以,有:给定估计的概率(1-),查t分布表得对应的临界点t/2(n-1)后,抽样极限误差的计算公式为:第25页/共69页27第三节第三节 简单随机抽样的简单随机抽样的抽样估计抽样估计一、点估计的概念一、点估计的概念一、点估计的概念一、点估计的概念 是直接以样本指标来估计总是直接以样本指标来估计总体指标,又称定值估计。体指标,又称定值估计。假设在假设在X X总
33、体中,总体中,为未知参数(均值、方差、成数等)。为未知参数(均值、方差、成数等)。由样本(由样本(x x1 1、x x2 2xxnn)构造统计量)构造统计量来估计未知参数来估计未知参数 ,称,称为为 的的点估计量点估计量。将某次抽样的样本观测值,代入将某次抽样的样本观测值,代入即得该估计量的一个即得该估计量的一个点估计值点估计值。第26页/共69页28(二)(二)(二)(二)估计量的评价标准估计量的评价标准估计量的评价标准估计量的评价标准 1 1、无偏性、无偏性、无偏性、无偏性抽样分布的均值等抽样分布的均值等于总体均值于总体均值 2 2、有效性、有效性、有效性、有效性估计量的估计量的方差应该方
34、差应该比较小比较小 3 3、一致性、一致性、一致性、一致性随着样本容量增大,随着样本容量增大,估计量会越来越接近被估计的估计量会越来越接近被估计的参数。参数。第27页/共69页29(三)常用的(三)常用的 优良点估计量优良点估计量 1 1、样本平均数及成数是总体平均数与成数样本平均数及成数是总体平均数与成数样本平均数及成数是总体平均数与成数样本平均数及成数是总体平均数与成数的无偏、有效、一致的估计量。的无偏、有效、一致的估计量。的无偏、有效、一致的估计量。的无偏、有效、一致的估计量。2 2、样本修正的方差是总体方差的无偏估计量。、样本修正的方差是总体方差的无偏估计量。、样本修正的方差是总体方差
35、的无偏估计量。、样本修正的方差是总体方差的无偏估计量。3 3、大样本条件下,样本方差是总体方差的渐、大样本条件下,样本方差是总体方差的渐、大样本条件下,样本方差是总体方差的渐、大样本条件下,样本方差是总体方差的渐进无偏估计量。进无偏估计量。进无偏估计量。进无偏估计量。第28页/共69页30二、区间估计二、区间估计(一)区间估计的原理(一)区间估计的原理 区区间间估估计计就就是是根根据据样样本本估估计计量量以以一一定定可可靠靠程程度度推推断断总总体体参参数所在的区间范围。数所在的区间范围。特特点点:考考虑虑了了估估计计量量的的分分布布,所所以以它它能能给给出出估估计计精精度度,也也能能说说明明估
36、估计计结结果果的的把把握握程程度度(置置信度)。信度)。第29页/共69页31(一)总体均值的置信区(一)总体均值的置信区间间(1 1)假定条件)假定条件)假定条件)假定条件n n总体服从正态分布总体服从正态分布总体服从正态分布总体服从正态分布,且总体方差(且总体方差(且总体方差(且总体方差()已知已知已知已知n n如果总体分布未知,可以由正态分布来近似如果总体分布未知,可以由正态分布来近似如果总体分布未知,可以由正态分布来近似如果总体分布未知,可以由正态分布来近似 (n n 30)30)(2 2)使用正态分布统计量)使用正态分布统计量)使用正态分布统计量)使用正态分布统计量(3 3)在)在)
37、在)在1-1-置信度下,置信度下,置信度下,置信度下,总体均值总体均值总体均值总体均值的的的的置信区间为:置信区间为:置信区间为:置信区间为:第30页/共69页32 例例3、某企业生产某种产、某企业生产某种产品的工人有品的工人有1000人,某日采用不人,某日采用不重复抽样从中随机抽取重复抽样从中随机抽取100人调人调查他们的当日产量,样本人均查他们的当日产量,样本人均产量为产量为35件,产量的样本标准件,产量的样本标准差为差为4.5件,试以件,试以95.45%的置信的置信度估计平均产量的抽样极限误度估计平均产量的抽样极限误差。差。350.86 350.86 第31页/共69页332、总体均值的
38、置信区间、总体均值的置信区间(未知未知)n n1.假定条件假定条件n n总体方差(总体方差(总体方差(总体方差()未知未知未知未知n n总体必须服从正态分布总体必须服从正态分布总体必须服从正态分布总体必须服从正态分布n n2.使用使用 t 分布统计量分布统计量3.3.3.总体均值在总体均值在总体均值在总体均值在总体均值在总体均值在1-1-1-置信度下的置信度下的置信度下的置信度下的置信度下的置信度下的置信区间为:置信区间为:置信区间为:置信区间为:置信区间为:置信区间为:第32页/共69页34例例例例:从从一一个个正正态态总总体体中中抽抽取取一一个个随随机机样样本本,n n =25 25,其其
39、均均值值为为 4040,修正的标准差为,修正的标准差为 6 6。试求总体均值的置信度为。试求总体均值的置信度为95%95%的置信区间。的置信区间。解解解解:已已 知知 N N(,2 2),x x=50,50,s*s*=6=6,n n=25,1-=25,1-=0.95=0.95,t t/2/2(2424)=2.0639=2.0639。我们可以我们可以9595的概率保证总体均值在的概率保证总体均值在37.52337.52342.47742.477之间之间第33页/共69页35 例例4、某某商商场场从从一一批批袋袋装装食食品品中中随随机机抽抽取取10袋袋,测测得得每每袋袋重重量量(单单位位:克克)分
40、分别别为为789、780、794、762、802、813、770、785、810、806,要要求求以以95的的把把握握程程度度,估估计计这这批批食食品品的的平平均均每每袋袋重量的区间范围及其允许误差。重量的区间范围及其允许误差。第34页/共69页36小结:小结:1.1.当总体方差已知时,总体均值的置信区间为:当总体方差已知时,总体均值的置信区间为:2.2.当总体方差未知时,总体均值的置信区间为当总体方差未知时,总体均值的置信区间为:总之,总体均值的置信区间可表示为:第35页/共69页37(二)总体比例的置(二)总体比例的置信区间信区间n n1.1.假定条件假定条件假定条件假定条件n n大样本:
41、大样本:大样本:大样本:n n 大于大于大于大于3030,则样本比,则样本比,则样本比,则样本比例的分布可以由正态分布来近例的分布可以由正态分布来近例的分布可以由正态分布来近例的分布可以由正态分布来近似。即似。即似。即似。即使用正态分布统计量使用正态分布统计量使用正态分布统计量使用正态分布统计量:2.2.2.总体比例总体比例总体比例总体比例总体比例总体比例 的置信区间为:的置信区间为:的置信区间为:的置信区间为:的置信区间为:的置信区间为:即:即:第36页/共69页381 1、大样本条件下总体方差的置信区间、大样本条件下总体方差的置信区间 大样本条件下,样本标准差大样本条件下,样本标准差S S
42、的分布近似的分布近似于均值为于均值为 ,抽样平均误差为,抽样平均误差为 的正态的正态分布,即:分布,即:所以总体标准差所以总体标准差 的的 的置信区间为:的置信区间为:(三)(三)(三)(三)正态正态正态正态总体方差的区间估计总体方差的区间估计总体方差的区间估计总体方差的区间估计第37页/共69页392 2、小样本下、小样本下、小样本下、小样本下设设设设总总总总体体体体服服服服从从从从正正正正态态态态分分分分布布布布N N (,2 2),则则则则与与与与样样样样本本本本方方方方差差差差 S S 2 2有关的统计量及其分布为:有关的统计量及其分布为:有关的统计量及其分布为:有关的统计量及其分布为
43、:将将将将 2 2(n n 1)1)称为自由度为称为自由度为称为自由度为称为自由度为(n n-1)-1)的卡方分布。的卡方分布。的卡方分布。的卡方分布。第38页/共69页402 2、小、小、小、小样本条件下总体方差的置信区间样本条件下总体方差的置信区间样本条件下总体方差的置信区间样本条件下总体方差的置信区间为:为:为:为:对于给定的置信度对于给定的置信度 ,查,查 分布表得临界值分布表得临界值 和和 ,的置信度为的置信度为 的置信区间:的置信区间:第39页/共69页41 例例5、随随机机从从某某车车间间加加工工的的同同类类零零件件中中抽抽取取16件件,测测得得其其的的平平均均长长度度为为12.
44、8厘厘米米,方方差差为为0.0023。假假定定零零件件的的长长度度服服从从正正态态分分布布,求求方方差差及及标标准准差差的置信区间(置信度为的置信区间(置信度为95)。)。第40页/共69页42 已已知知:16,0.0023,1-0.95,查,查 分布表得分布表得:代入数据,可得所求方差的置信区间为(代入数据,可得所求方差的置信区间为(0.0013,0.0059),标准差的置信区间(),标准差的置信区间(0.036,0.077)第41页/共69页43目的目的前提条件前提条件 置信度的置信区间置信度的置信区间估计总体估计总体均值均值正态总体正态总体方差已知方差已知估计总体估计总体均值均值正态总体
45、正态总体方差未知方差未知(小样本)估计总体估计总体均值均值置信区间一览表置信区间一览表总体分布知,总体分布知,正态总体方正态总体方差未知差未知(大样本)(大样本)第42页/共69页44目的目的前提条件前提条件置信度的置信区间置信度的置信区间属性总体属性总体大样本大样本估计总体估计总体方差方差正态总体正态总体小样本小样本估计总估计总体体成数成数估计总估计总体体方差方差大样本大样本第43页/共69页45三、样本容量的确定三、样本容量的确定(一)确定样本容量的意义(一)确定样本容量的意义(一)确定样本容量的意义(一)确定样本容量的意义n n必要抽样数目的定义必要抽样数目的定义必要抽样数目的定义必要抽
46、样数目的定义为使抽为使抽样误差在一定置信度下不超过样误差在一定置信度下不超过允许范围所必须的抽样数目。允许范围所必须的抽样数目。(二)(二)(二)(二)样本容量的确定样本容量的确定n n必要抽样数目的计算公式必要抽样数目的计算公式一般由抽样极限误差(即允许一般由抽样极限误差(即允许误差)的计算公式推导而得。误差)的计算公式推导而得。n n(三)必要抽样数目的影响因素(三)必要抽样数目的影响因素(三)必要抽样数目的影响因素(三)必要抽样数目的影响因素 第44页/共69页46设设样样本本均均值值与与总总体体均均值值之之间间的的允允许许误误差差为为 ,已已知知总总体体方方差差时时,在在 的的置置信度
47、下,估计总体均值时的样本容量为:信度下,估计总体均值时的样本容量为:重复抽样下:重复抽样下:不重复抽样下:不重复抽样下:1 1、估计总体均值的样本容量估计总体均值的样本容量估计总体均值的样本容量估计总体均值的样本容量第45页/共69页472、估计总体成数时的样本容量、估计总体成数时的样本容量设设 为估计总体成数的允许误差,在为估计总体成数的允许误差,在 的置信度下,样本容量的置信度下,样本容量 n 为:为:重复抽样下:重复抽样下:不重复抽样下:不重复抽样下:第46页/共69页48例例五五、某某食食品品厂厂要要检检验验本本月月生生产产的的10,000袋袋某某产产品品的的重重量量,根根据据上上月月
48、资资料料,这这种种产产品品每每袋袋重重量量的的标标准准差差为为25克克。要要求求在在95.45的的概概率率保保证证程程度度下下,平平均均每每袋袋重重量量的的误误差差范范围围不超过不超过5克,应抽查多少袋产品?克,应抽查多少袋产品?解解:已已知知:10,000,25克克,克,克,95.45即即 2,第47页/共69页49在重复抽样条件下:在重复抽样条件下:袋袋在不重复抽样条件下:在不重复抽样条件下:=99袋第48页/共69页50练习:练习:某某企企业业对对一一批批产产品品进进行行质质量量检检验验,这这批批产产品品的的总总数数为为5,000件件,过过去去几几次次同同类类调调查查所所得得的的产产品品
49、合合格格率率为为93、95和和96,为为了了使使合合格格率率的的允允许许误误差差不不超超过过3,在在99.73的的概概率率下下应应抽抽查查多多少少件件产产品?品?第49页/共69页511 1、总体的变异程度高低、总体的变异程度高低(总体方差的大小)(总体方差的大小)其它条件不变的条件下,总体单位的差异程度大,其它条件不变的条件下,总体单位的差异程度大,则应多抽,反之可少抽一些。则应多抽,反之可少抽一些。怎样估计总体方差呢?怎样估计总体方差呢?通常是用以前同类调查的资料代替,或用同类地区的资料代替,若有多个方差数值供参考时,应选其中最大的方差。通常是用以前同类调查的资料代替,或用同类地区的资料代
50、替,若有多个方差数值供参考时,应选其中最大的方差。(三)影响样本容量的因素(三)影响样本容量的因素第50页/共69页522、允许误差范围、允许误差范围 允允许许误误差差增增大大,意意味味着着推推断断的的精精度度要要求求降降低低,在在其其他他条条件件不不变变的的情情况况下下,必必要要的的抽抽样样数数目目可可减减少少。反反之之,缩缩小小允允许许误误差差,就就要要增增加加必必要要的的抽样数目。抽样数目。第51页/共69页533、置信度、置信度 因因置置信信度度与与置置信信区区间间是是同同方方向向变变化化的的,所所以以在在其其它它条条件件不不变变的的情情况况下下,要要提提高高推推断断的的置信程度,就必