统计学Chapter 5.ppt-淘文阁

资源描述

《统计学Chapter 5.ppt》由会员分享，可在线阅读，更多相关《统计学Chapter 5.ppt（41页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、统计学：思想、方法与应用统计学：思想、方法与应用袁卫袁卫刘超刘超第第5 5章章参数估计参数估计5.1 样本统计量和总体参数样本统计量和总体参数5.2 点估计点估计5.3 抽样分布与中心极限定理抽样分布与中心极限定理5.4 区间估计：给结论留一些余地区间估计：给结论留一些余地5.5 合适样本量的确定合适样本量的确定学习目标学习目标知道统计量与总体参数的关系；知道统计量与总体参数的关系；知道什么是点估计和区间估计；知道什么是点估计和区间估计；了解衡量估计量好坏的标准；了解衡量估计量好坏的标准；熟悉几种抽样分布以及中心极限定理；熟悉几种抽样分布以及中心极限定理；理解置信区间的概念；理解置信区

2、间的概念；能构造总体均值的置信区间或区间估计；能构造总体均值的置信区间或区间估计；能构造总体比例的置信区间或区间估计；能构造总体比例的置信区间或区间估计；确定合适的样本量确定合适的样本量从数据中提取与研究问题有关的信息，并利用它得到关从数据中提取与研究问题有关的信息，并利用它得到关于现实世界的结论的过程就叫做于现实世界的结论的过程就叫做统计推断统计推断(statistical inference)。估计估计(estimation)是统计推断的重要内容之一。是统计推断的重要内容之一。统计推断的另一个主要内容是下一章要介绍的统计推断的另一个主要内容是下一章要介绍的假设检验假设检验(hypothes

3、is testing)。尽管样本中的信息并不完全，而且来自于样本的结果一尽管样本中的信息并不完全，而且来自于样本的结果一般不等于总体真实值，但是我们还是经常采用样本数据。般不等于总体真实值，但是我们还是经常采用样本数据。之所以需要用样本代替总体进行研究，原因在于在通常之所以需要用样本代替总体进行研究，原因在于在通常情况下，我们对整个总体进行全面调查是不可行的，可情况下，我们对整个总体进行全面调查是不可行的，可能是对整个总体进行调查过于费时，对总体进行逐一调能是对整个总体进行调查过于费时，对总体进行逐一调查费用过高或者抽样得到的结果就已经满足我们分析的查费用过高或者抽样得到的结果就已经满足我们分

4、析的要求，或者检验可能是破坏性的。要求，或者检验可能是破坏性的。估计就是根据你拥有的信息来对现实世界进行某种估计就是根据你拥有的信息来对现实世界进行某种判断。判断。你可以根据一个人的衣着、言谈和举止判断其身份你可以根据一个人的衣着、言谈和举止判断其身份你可以根据一个人的脸色，猜出其心情和身体状况你可以根据一个人的脸色，猜出其心情和身体状况统计中的估计也不例外，它是完全根据数据做出的。统计中的估计也不例外，它是完全根据数据做出的。如果我们想知道北京人认可某饮料的比例，人们只如果我们想知道北京人认可某饮料的比例，人们只有在北京人中进行抽样调查以得到样本，并用样本有在北京人中进行抽样调查以得到样本，

5、并用样本中认可该饮料的比例来估计真实的比例。中认可该饮料的比例来估计真实的比例。从不同的样本得到的结论也不会完全一样。虽然真从不同的样本得到的结论也不会完全一样。虽然真实的比例在这种抽样过程中永远也不知道；但可以实的比例在这种抽样过程中永远也不知道；但可以知道估计出来的比例和真实的比例大致差多少。知道估计出来的比例和真实的比例大致差多少。5.1 5.1 用估计量估计总体参数用估计量估计总体参数人们往往先假定某数据来自一个特定的人们往往先假定某数据来自一个特定的总体族（比如正态分布族）。总体族（比如正态分布族）。而要确定是总体族的哪个成员则需要知而要确定是总体族的哪个成员则需要知道总体参数值（比

6、如总体均值和总体方道总体参数值（比如总体均值和总体方差）。差）。人们于是可以用相应的样本统计量（比人们于是可以用相应的样本统计量（比如样本均值和样本方差）来估计相应的如样本均值和样本方差）来估计相应的总体参数。总体参数。5.1 5.1 用估计量估计总体参数用估计量估计总体参数一些常见的涉及总体的参数包括总体均一些常见的涉及总体的参数包括总体均值值(m m)、总体标准差、总体标准差(s s)或方差或方差(s s2 2)和和(Bernoulli试验中试验中)成功概率成功概率p等（总体中等（总体中含有某种特征的个体之比例）。含有某种特征的个体之比例）。正态分布族中的成员被（总体）均值和正态分布族中的

7、成员被（总体）均值和标准差完全确定；标准差完全确定；Bernoulli分布族的成员被概率（或比例）分布族的成员被概率（或比例）p完全决定。完全决定。因此如果能够对这些参数进行估计，总因此如果能够对这些参数进行估计，总体分布也就估计出来了。体分布也就估计出来了。5.1 5.1 用估计量估计总体参数用估计量估计总体参数估计的根据为总体抽取的样本。估计的根据为总体抽取的样本。样本的（不包含未知总体参数的）函数样本的（不包含未知总体参数的）函数称为统计量；而用于估计的统计量称为称为统计量；而用于估计的统计量称为估计量估计量(estimator)。由于一个统计量对于不同的样本取值不由于一个统计量对于不同

8、的样本取值不同，所以，估计量也是随机变量，并有同，所以，估计量也是随机变量，并有其分布。其分布。如果样本已经得到，把数据带入之后，如果样本已经得到，把数据带入之后，估计量就有了一个数值，称为该估计量估计量就有了一个数值，称为该估计量的一个的一个实现实现(realization)或取值，也称为或取值，也称为一个一个估计值估计值(estimate)。5.1 5.1 用估计量估计总体参数用估计量估计总体参数这里介绍两种估计，一种是这里介绍两种估计，一种是点估计点估计(point estimation)(point estimation)，即用估计量的实，即用估计量的实现值来近似相应的总体参数现值来近

9、似相应的总体参数。另另一种是一种是区间估计区间估计(interval(interval estimation)estimation)；它是包括估计量在内；它是包括估计量在内（有时是以估计量为中心）的一个区间；（有时是以估计量为中心）的一个区间；该区间被认为很可能包含总体参数。该区间被认为很可能包含总体参数。点估计给出一个数字，用起来很方便；点估计给出一个数字，用起来很方便；而区间估计给出一个区间，说起来留有而区间估计给出一个区间，说起来留有余地；不像点估计那么绝对。余地；不像点估计那么绝对。5.2 5.2 点估计点估计用什么样的估计量来估计参数呢？用什么样的估计量来估计参数呢？实际上没有硬性限

10、制。任何统计量，只实际上没有硬性限制。任何统计量，只要人们觉得合适就可以当成估计量。要人们觉得合适就可以当成估计量。当然，统计学家想出了许多标准来衡量当然，统计学家想出了许多标准来衡量一个估计量的好坏。每个标准一般都仅一个估计量的好坏。每个标准一般都仅反映估计量的某个方面。反映估计量的某个方面。这样就出现了按照这些标准定义的各种这样就出现了按照这些标准定义的各种名目的估计量（如无偏估计量等）。名目的估计量（如无偏估计量等）。另一些估计量则是由它们的计算方式来另一些估计量则是由它们的计算方式来命名的（如最大似然估计和矩估计等）命名的（如最大似然估计和矩估计等）。5.2 5.2 点估计点估计最常用

11、的估计量就是我们熟悉的样本均最常用的估计量就是我们熟悉的样本均值、样本标准差值、样本标准差(s)和和(Bernoulli试验的试验的)成成功比例功比例(x/n)；人们用它们来分别估计总体均值人们用它们来分别估计总体均值(m m)、总、总体标准差体标准差(s s)和成功概率和成功概率(或总体中的比例或总体中的比例)p。这些在前面都已经介绍过，大家也知。这些在前面都已经介绍过，大家也知道如何通过计算机（或公式）来计算它道如何通过计算机（或公式）来计算它们。们。5.2 5.2 点估计点估计那么，什么是好估计量的标准呢？那么，什么是好估计量的标准呢？一种统计量称为一种统计量称为无偏估计量无偏估计量(u

12、nbiased estimator)。所谓的所谓的无偏性无偏性(unbiasedness)就是：就是：虽然每个样本产生的估计量的取值虽然每个样本产生的估计量的取值不一定等于参数，但当抽取大量样不一定等于参数，但当抽取大量样本时，那些样本产生的估计量的均本时，那些样本产生的估计量的均值会接近真正要估计的参数。值会接近真正要估计的参数。5.2 5.2 点估计点估计由于一般仅仅抽取一个样本，并且用该由于一般仅仅抽取一个样本，并且用该样本的这个估计量的实现来估计对应的样本的这个估计量的实现来估计对应的参数，人们并不知道这个估计值和要估参数，人们并不知道这个估计值和要估计的参数差多少。计的参数差多少。因

13、此，无偏性仅仅是非常多次重复抽样因此，无偏性仅仅是非常多次重复抽样时的一个渐近概念。时的一个渐近概念。随机样本产生的样本均值、样本标准差随机样本产生的样本均值、样本标准差和和Bernoulli试验的成功比例分别都是相试验的成功比例分别都是相应的总体均值、总体标准差和总体比例应的总体均值、总体标准差和总体比例的无偏估计。的无偏估计。5.2 5.2 点估计点估计在无偏估计量的类中，人们还希望寻找在无偏估计量的类中，人们还希望寻找方差最小的估计量，称为最小方差无偏方差最小的估计量，称为最小方差无偏估计量。估计量。此因为方差小说明反复抽样产生的许多此因为方差小说明反复抽样产生的许多估计量差别不大，因此

14、更加精确。估计量差别不大，因此更加精确。评价一个统计量好坏的标准很多；而且评价一个统计量好坏的标准很多；而且许多都涉及一些大样本的极限性质。我许多都涉及一些大样本的极限性质。我们不想在这里涉及太多此方面的细节。们不想在这里涉及太多此方面的细节。5.3 5.3 抽样分布与中心极限定理抽样分布与中心极限定理相同样本量的样本统计量会随着样本不相同样本量的样本统计量会随着样本不同而不同，即样本统计量作为随机样本同而不同，即样本统计量作为随机样本的函数也是随机的，也有自己的分布，的函数也是随机的，也有自己的分布，这些分布就称为这些分布就称为抽样分布（抽样分布（sampling distribution）

15、。5.3.1 5.3.1 样本均值的抽样分布样本均值的抽样分布很容易得到左表的总体均值=2056.5元。为获得样本均值的抽样分布，假设样本量取为2，右表列出了所有15种可能的样本和相应的总和及样本均值。显然这些样本均值都和真正的总体均值2056.5元有些差别，但是这15个样本均值的平均值却为2056.5元。x1x2x3x4x5x61427 1716 1844 2037 2366 2949样本组合总和1X1，X231431571.52X1，X332711635.53X1，X4346417324X1，X537931896.55X1，X6437621886X2，X3356017807X2，X437

16、531876.58X2，X5408220419X2，X646652332.510X3，X438811940.511X3，X54210210512X3，X647932396.513X4，X544032201.514X4，X64986249315X5，X653152657.55.3.1 5.3.1 样本均值的抽样分布样本均值的抽样分布图5.2描绘了总体分布和样本均值分布情况。5.3.1 5.3.1 样本均值的抽样分布样本均值的抽样分布可得到如下的结论：可得到如下的结论：（1）样本均值分布的均值等于总体均值：）样本均值分布的均值等于总体均值：。（2）样本均值分布的延伸范围小于总体分布。样本均）样本

17、均值分布的延伸范围小于总体分布。样本均值的起止点分别为值的起止点分别为1571.5元和元和2657.5元，而总体值则从元，而总体值则从1427元至元至2949元不等。事实上，样本均值分布的标准差元不等。事实上，样本均值分布的标准差等于总体标准差除以样本量的算术平方根，即为等于总体标准差除以样本量的算术平方根，即为。注意到如果我们增加样本量，那么样本均值分布的范。注意到如果我们增加样本量，那么样本均值分布的范围将缩小。围将缩小。（3）样本均值的抽样分布形态与总体频数分布形态不）样本均值的抽样分布形态与总体频数分布形态不同。样本均值分布更接近钟形，近似于正态概率分布。同。样本均值分布更接近钟形，

18、近似于正态概率分布。5.3.2 5.3.2 中心极限定理中心极限定理中心极限定理的准确叙述如下：若给定样本量中心极限定理的准确叙述如下：若给定样本量的所有样本来自任意总体，则样本均值的抽样的所有样本来自任意总体，则样本均值的抽样分布近似服从正态分布，且样本量越大，近似分布近似服从正态分布，且样本量越大，近似性越强。性越强。为了直观地说明中心极限定理的意义，我们从为了直观地说明中心极限定理的意义，我们从在在(0,1)的均匀分布对于四种样本量大小的均匀分布对于四种样本量大小n=1，2，5，20分别取分别取1000个样本，对每个样本算出个样本，对每个样本算出均值，于是对每一种样本量都有均值，于是对每

19、一种样本量都有1000个均值，个均值，用这些均值画出下面的直方图用这些均值画出下面的直方图5.3。从图中可以。从图中可以看出，样本量越大，均值的直方图越像正态变看出，样本量越大，均值的直方图越像正态变量的直方图，而且数据的分散程度也越小（越量的直方图，而且数据的分散程度也越小（越集中）。集中）。5.3.2 5.3.2 中心极限定理中心极限定理5.3.2 5.3.2 中心极限定理中心极限定理根据中心极限定理可知，样本均值根据中心极限定理可知，样本均值作为随机变量有如下的性作为随机变量有如下的性质（注意，这里并没有假定质（注意，这里并没有假定X X的分布）：的分布）：（1 1）如果能够选择给定

20、总体的特定容量的所有可能样本，那么，）如果能够选择给定总体的特定容量的所有可能样本，那么，样本均值的抽样分布的均值将恰好等于总体均值样本均值的抽样分布的均值将恰好等于总体均值，即使我们，即使我们不能得到所有样本，但可以预计，样本均值分布的均值会接近于总不能得到所有样本，但可以预计，样本均值分布的均值会接近于总体均值。体均值。（2 2）样本均值的抽样分布的离散程度小于总体分布。若总体标准）样本均值的抽样分布的离散程度小于总体分布。若总体标准差是差是，则样本均值的抽样分布的标准差为，则样本均值的抽样分布的标准差为。当增大样本。当增大样本量时，量时，值将变小，即值将变小，即的集中程度越大。的

21、集中程度越大。（3 3）即使）即使X X的分布不是正态，那么在很一般的条件下，当样本量增的分布不是正态，那么在很一般的条件下，当样本量增加时，加时，的分布趋近于正态分布的分布趋近于正态分布。5.4 5.4 区间估计区间估计当描述一个人的体重时，你一般可能不当描述一个人的体重时，你一般可能不会说这个人是会说这个人是76.35公斤公斤你会说这个人是七八十公斤，或者是在你会说这个人是七八十公斤，或者是在70公斤到公斤到80公斤之间。这个范围就是区公斤之间。这个范围就是区间估计的例子。间估计的例子。5.4 5.4 区间估计区间估计在抽样调查例子中也常用点估计加区间在抽样调查例子中也常用点估计加区间估

22、计的说法。估计的说法。比如，为了估计某电视节目在观众中的比如，为了估计某电视节目在观众中的支持率（即总体比例支持率（即总体比例p），某调查结果），某调查结果会显示，该节目的会显示，该节目的“收视率为收视率为90%，误，误差是差是3%，置信度为，置信度为95%”云云。这这云云。这这种说法意味着下面三点种说法意味着下面三点5.4 5.4 区间估计区间估计1.样本中的支持率为样本中的支持率为90%，即用样本比，即用样本比例作为对总体比例的点估计例作为对总体比例的点估计2.估计范围为估计范围为90%3%(3%的误差的误差)，即区间即区间(93%，87%)。3.如用类似的方式，重复抽取大量（样如用类似的

23、方式，重复抽取大量（样本量相同的）样本时，产生的大量类似本量相同的）样本时，产生的大量类似区间中有些会覆盖真正的区间中有些会覆盖真正的p，而有些不会；，而有些不会；但其中大约有但其中大约有95%会覆盖真正的总体比会覆盖真正的总体比例。例。5.4 5.4 区间估计区间估计这样得到的区间被称为总体比例这样得到的区间被称为总体比例p的置信度的置信度(confidence level)为为95%的置信区间的置信区间(confidence interval)。这里的置信度又称置。这里的置信度又称置信水平或置信系数。信水平或置信系数。显然置信度的概念又是大量重复显然置信度的概念又是大量重复抽样时的一个渐近

24、概念。抽样时的一个渐近概念。5.4 5.4 区间估计区间估计因此说因此说“我们目前得到的区间（比如上我们目前得到的区间（比如上面的面的90%3%）以概率）以概率0.95覆盖真正的覆盖真正的比例比例p”是个错误的说法。是个错误的说法。这里的区间这里的区间(93%，87%)是固定的，而是固定的，而总体比例总体比例p也是固定的值。因此只有两也是固定的值。因此只有两种可能：或者该区间包含总体比例，或种可能：或者该区间包含总体比例，或者不包含；者不包含；在固定数值之间没有任何概率可言。在固定数值之间没有任何概率可言。5.4 5.4 区间估计区间估计例例5.1(noodle.txt)某某厂厂家家生生产产的

25、的挂挂面面包包装装上上写写明明“净净含含量量450克克”。在在用用天天平平称称量量了了商商场场中中的的48包包挂挂面面之之后后，得得到到样样本本量量为为48的的关关于于挂挂面面重重量量（单位：克）的一个样本：（单位：克）的一个样本：用计算机可以很容易地得到挂面重量的用计算机可以很容易地得到挂面重量的样本均值、总体均值的置信区间等等。样本均值、总体均值的置信区间等等。下面是下面是SPSS的输出：的输出：该输出给出了许多第三章引进的描述统计量。该输出给出了许多第三章引进的描述统计量。和估计有关的是作为总体均点估计的样本均和估计有关的是作为总体均点估计的样本均值，它等于值，它等于449.01；而总体

26、均值的；而总体均值的95%置信置信区间为（区间为（447.41，450.61）5.4 5.4 区间估计区间估计我们还可以构造两个总体的均值（或比我们还可以构造两个总体的均值（或比例）之差的置信区间。例）之差的置信区间。如想知道两个地区学生成绩的差异，可如想知道两个地区学生成绩的差异，可以建造两个地区成绩均值之差以建造两个地区成绩均值之差m m1-m m2的的置信区间。置信区间。如想比较一个候选人在不同阶段支持率如想比较一个候选人在不同阶段支持率的差异，那就可构造比例之差的差异，那就可构造比例之差p1-p2的置的置信区间。信区间。5.4 5.4 区间估计区间估计例例5.2有两个地区大学生的高度数

27、据有两个地区大学生的高度数据(height2.txt)(a)我我们们想想要要分分别别得得到到这这两两个个总总体体均均值值和和标标准准差差的的点点估估计计（即即样样本本均均值值和和样样本本标标准准差差）和和各各总总体体均均值值的的95%置信区间。置信区间。(b)求求两两个个均均值值差差m m1-m m2的的点点估估计计和和95%置置信信区区间间。利利用用软软件件很很容容易易得得到到下下面结果：面结果：5.4 5.4 区间估计区间估计两个总体均值估计量的样本均值分别为两个总体均值估计量的样本均值分别为170.56和和165.60，样本标准差分别为，样本标准差分别为6.97857和和7.55659；

28、还得到均值的置信区；还得到均值的置信区间分别是间分别是(168.5767,172.5433),(163.4524,167.7476)。可以得到两个样本均值的差可以得到两个样本均值的差(4.9600)，另，另外还给出了两总体均值差的外还给出了两总体均值差的95%置信区置信区间间(2.073，7.847)。5.4 5.4 关于置信区间的注意点关于置信区间的注意点前面提到，不要认为由前面提到，不要认为由某一样本某一样本数据得数据得到总体参数的到总体参数的某一个某一个95%置信区间，就置信区间，就以为以为该该区间以区间以0.95的概率覆盖总体参数。的概率覆盖总体参数。置信度置信度95%仅仅描述用来构造

29、该区间上仅仅描述用来构造该区间上下界的下界的统计量统计量(是随机的是随机的)覆盖总体参数覆盖总体参数的概率；的概率；也就是说，无穷次重复抽样所得到的所也就是说，无穷次重复抽样所得到的所有区间中有有区间中有95%包含参数。包含参数。5.4 5.4 关于置信区间的注意点关于置信区间的注意点但是把一个样本数据带入统计量的公式但是把一个样本数据带入统计量的公式所得到的一个区间，只是这些区间中的所得到的一个区间，只是这些区间中的一个。一个。这个非随机的区间是否包含那个非随机这个非随机的区间是否包含那个非随机的总体参数，谁也不可能知道。非随机的总体参数，谁也不可能知道。非随机的数目之间没有概率可言。的数目

30、之间没有概率可言。5.4 5.4 关于置信区间的注意点关于置信区间的注意点置信区间的论述是由区间和置信度两部分组置信区间的论述是由区间和置信度两部分组成。成。有些新闻媒体报道一些调查结果只给出百分有些新闻媒体报道一些调查结果只给出百分比和误差（即置信区间），并不说明置信度，比和误差（即置信区间），并不说明置信度，也不给出被调查的人数，这是不负责的表现。也不给出被调查的人数，这是不负责的表现。因为降低置信度可以使置信区间变窄（显得因为降低置信度可以使置信区间变窄（显得“精确精确”），有误导读者之嫌。在公布调查），有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这结果时给出被调查人数

31、是负责任的表现。这样则可以由此推算出置信度（由后面给出的样则可以由此推算出置信度（由后面给出的公式），反之亦然。公式），反之亦然。5.4 5.4 关于置信区间的注意点关于置信区间的注意点一个描述性例子：有一个描述性例子：有10000个人回答的调查个人回答的调查显示，同意某观点人的比例为显示，同意某观点人的比例为70%（有（有7000人同意），可算出总体中同意该观点的比例人同意），可算出总体中同意该观点的比例的的95%置信区间为（置信区间为（0.691，0.709）；）；另一个调查声称有另一个调查声称有70%的比例反对该种观点，的比例反对该种观点，还说总体中反对该观点的置信区间也是还说总体中反对

32、该观点的置信区间也是（0.691，0.709）。）。到底相信谁呢？实际上，第二个调查隐瞒了到底相信谁呢？实际上，第二个调查隐瞒了置信度。如果第二个调查仅仅调查了置信度。如果第二个调查仅仅调查了50个人，个人，有有35个人反对该观点。则其置信区间的置信个人反对该观点。则其置信区间的置信度仅有度仅有11%。5.5 5.5 合适样本量的确定合适样本量的确定5.5.1 估计总体比例时样本量的确定估计总体比例时样本量的确定调查研究中一个经常需要关心的问题是调查研究中一个经常需要关心的问题是“样本量要样本量要多大才行？多大才行？”样本量过大不经济，样本量过小又不能保证估计样本量过大不经济，样本量过小又不能

33、保证估计的精度。的精度。确定合适的样本量需要考虑以下三方面因素：确定合适的样本量需要考虑以下三方面因素：（1）希望达到的置信度。置信度越高，样本量越大。）希望达到的置信度。置信度越高，样本量越大。（2）研究者可以承受的误差范围。可容许误差越小）研究者可以承受的误差范围。可容许误差越小要求样本量越大，反之则样本量越小。要求样本量越大，反之则样本量越小。（3）所研究总体比例的估计。）所研究总体比例的估计。5.5.1 5.5.1 估计总体比例时样本量的确定估计总体比例时样本量的确定将上述三方面结合起来，得到总体比例将上述三方面结合起来，得到总体比例的样本量由下面的公式确定：的样本量由下面的公式确定：

34、其中：其中：是对应于某置信度的标准正态分布值；是对应于某置信度的标准正态分布值；E是最大可容许误差。是最大可容许误差。可以从预调查或者其他途径得到总体比例可以从预调查或者其他途径得到总体比例的估计，的估计，否则我们就用否则我们就用0.50作为估计值。作为估计值。上式的结果通常并不是整数。当出现这种情况时，上式的结果通常并不是整数。当出现这种情况时，我们取不小于该数的最小整数。我们取不小于该数的最小整数。5.5.1 5.5.1 估计总体比例时样本量的确定估计总体比例时样本量的确定例例5.13 假如一个学公共管理的学生想估计有专职垃圾收集工假如一个学公共管理的学生想估计有专职垃圾收集工人的城市的

35、比例。他希望对总体比例的估计的误差不超过总人的城市的比例。他希望对总体比例的估计的误差不超过总体比例的体比例的0.10，置信度为，置信度为90%，总体比例的估计未知，计算，总体比例的估计未知，计算所需样本量。所需样本量。因为假设估计总体比例的最大误差因为假设估计总体比例的最大误差E为为0.10，置信度为，置信度为0.90，相应的相应的z值为值为1.65。由于总体比例的估计未知，取其为。由于总体比例的估计未知，取其为0.50，于是所需的样本量为：于是所需的样本量为：于是我们建议的样本量为于是我们建议的样本量为69。如果我们要提高置信度到如果我们要提高置信度到99%，则样本量应相应增加，在，则样本

36、量应相应增加，在99%的置信度下对应的的置信度下对应的z值为值为2.58，此时样本量为，此时样本量为我们推荐样本量为我们推荐样本量为167。因此，当置信度由因此，当置信度由95%提高到提高到99%时，样本量增加时，样本量增加97。这会。这会大大增加调查的时间和成本，因此置信度的选择应该慎重。大大增加调查的时间和成本，因此置信度的选择应该慎重。5.5.2 5.5.2 估计总体均值时样本量的确定估计总体均值时样本量的确定关于均值估计问题样本量的确定与上面的过关于均值估计问题样本量的确定与上面的过程基本一致，也有三个因素需要确定：程基本一致，也有三个因素需要确定：（1）希望达到的置信度。）希望达到的

37、置信度。（2）研究者可以承受的误差大小。）研究者可以承受的误差大小。（3）总体的标准差的估计。）总体的标准差的估计。前两个因素与总体比例的样本量估计情况是前两个因素与总体比例的样本量估计情况是一致的，不一样的地方是此处要估计总体的一致的，不一样的地方是此处要估计总体的标准差。在通常的情况下我们并不知道总体标准差。在通常的情况下我们并不知道总体标准差，因此我们必须对其进行估计。标准差，因此我们必须对其进行估计。5.5.2 5.5.2 估计总体均值时样本量的确定估计总体均值时样本量的确定将上述三方面结合起来，得到总体比例将上述三方面结合起来，得到总体比例的样本量由下面的公式确定：的样本量由下面的公

38、式确定：其中：其中：是对应于某置信度的标准正态分布值；是对应于某置信度的标准正态分布值；E是最大可容许误差。是最大可容许误差。可以从预调查或者其他途径得到总体比例可以从预调查或者其他途径得到总体比例的估计，的估计，否则我们就用否则我们就用0.50作为估计值。作为估计值。上式的结果通常并不是整数。当出现这种情况时，上式的结果通常并不是整数。当出现这种情况时，我们取不小于该数的最小整数。我们取不小于该数的最小整数。5.5.2 5.5.2 估计总体均值时样本量的确定估计总体均值时样本量的确定例例5.14 一个学公共管理的学生还想了解在大城市中从事政策咨询一个学公共管理的学生还想了解在大城市中从事政

39、策咨询的顾问每月可以得到多少酬劳。在的顾问每月可以得到多少酬劳。在95%的置信度下，要求均值的的置信度下，要求均值的估计误差不超过估计误差不超过100元。此外他从劳动部得到的资料估计总体标准元。此外他从劳动部得到的资料估计总体标准差约为差约为1000元。计算需要的样本量。元。计算需要的样本量。因为假设最大可容许误差因为假设最大可容许误差E为为100元，元，95%的置信度所对应的的置信度所对应的z值值为为1.96，总体标准差的估计为，总体标准差的估计为1000元。将数据代入估计总体均值元。将数据代入估计总体均值所需样本量的公式可得到样本量为：所需样本量的公式可得到样本量为：结果为结果为384.16，实际取为，实际取为385。样本量。样本量385可以满足他的要求。如可以满足他的要求。如果我们要提高置信度到果我们要提高置信度到99%，则样本量应相应增加，在，则样本量应相应增加，在99%的置的置信度下对应的信度下对应的z值为值为2.58，此时样本量为，此时样本量为我们推荐样本量为我们推荐样本量为666。类似于总体比例的样本量的情况，同样可发现，当置信度由类似于总体比例的样本量的情况，同样可发现，当置信度由95%提高到提高到99%时，样本量增加时，样本量增加281，因此置信度的选择应该慎重。，因此置信度的选择应该慎重。

展开阅读全文