《山西通信市场抽样调查样本量配置方法5788.docx》由会员分享,可在线阅读,更多相关《山西通信市场抽样调查样本量配置方法5788.docx(8页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、山西通信信市场抽抽样调查查样本量量配置方方法作者:*关键词:市场调调查 样本本量 配置置方案摘要: 本文从从市场调调查的实实践出发发,结合合通信市市场用户户的消费费特征和和实施调调研的数数据统计计过程,系系统地整整理并提提出了样样本量配配置的分分布表,并并在两项项有关电电信市场场的调研研中进行行了实践践,取得得了满意意的效果果。本文文的主要要结论对对现实的的市场研研究具有有较高的的参考价价值和简简易的可可操作性性,同时时可以很很好地保保证样本本的精确确程度,减减小抽样样误差。无无论是全全面调查查还是抽抽样调查查,样本本产生的的误差都都是不可可避免的的。因此此,为了了获得较较高精度度和较高高可靠
2、性性的数据据,与误误差作斗斗争就成成为市场场调研最最大的课课题之一一。依照照传统的的理论习习惯,人人们在研研究实践践中通常常采用调调整样本本量和改改进抽样样技术的的方法来来减小误误差和提提高调研研的精确确度。但但问题是是,虽然然我们可可以用较较大的样样本来弥弥补抽样样技术的的误差,用用足够多多的样本本数来保保证市场场数据的的真实可可靠,但但委托方方对样本本量增多多而带来来的调研研成本的的提高也也非常敏敏感,调调研的经经济约束束要求我我们用最最少的样样本数来来达到最最大的抽抽样精确确度。一一、 影影响样本本量的主主要因素素在在市场调调研实践践中,样样本量是是关系到到调研精精确度和和市场研研究公司
3、司效益的的一项重重要指标标。确定定样本量量是抽样样方案的的一个重重要内容容,也是是实施抽抽样前必必须解决决的一个个问题。样样本量过过大,会会使调查查费用显显著增加加,人力力及管理理费用加加大,从从而也难难以体现现抽样调调查的优优越性;样本量量过小,又又会使样样本对总总体的代代表性降降低,增增大抽样样误差。因因此,解解决抽样样设计中中的样本本量问题题至关重重要。从从统计学学的角度度来看,影影响样本本量的因因素主要要包括置置信度和和允许误误差。简简言之,置置信度是是对抽样样估计可可靠性的的度量,允允许误差差是指事事先要求求与一定定的置信信概率相相对应的的抽样误误差 的的最大范范围,它它是对抽抽样估
4、计计的精确确度提出出的要求求。另一方面面,就具具体的调调研项目目而言,项项目的总总预算费费用又构构成了样样本量的的一个上上限。容容量过大大就会突突破预算算约束,导导致超支支,这是是受托方方风险。设设经费总总额为cc,费用用函数可可以表示示为 其中, 为固定定费用,与与样本量量无关; 为平平均每一一样本单单位需要要的调查查经费。由由此解出出的样本本量 ,可可以作为为经费约约束的一一个基本本条件。 二、 简单随随机抽样样样本量量的测度度方法 1. 基本公公式在简单随随机抽样样的条件件下,我我们所使使用的确确定调查查样本量量的公式式为: 其中:nn代表所所需要样样本量;Z表示示置信水水平下的的Z统计
5、计量,如如95%置信水水平的ZZ统计量量为1.96,999%的的Z为22.688;S代代表总体体的标准准差;dd代表置置信区间间的1/2,在在实际应应用中就就是容许许误差,或或者调查查误差。对于比例例型变量量,确定定样本量量的公式式为:其中:nn表示样样本量;z表示示置信水水平下的的z统计计量,如如95%置信水水平的ZZ统计量量为1.96,99%的为22.688;p表表示目标标总体的的比例期期望值;d表示示置信区区间的半半宽,即即调查误误差。2公式式的应用用一些参数数是我们们可以事事先确定定的:ZZ值取决决于置信信水平,通通常我们们可以考考虑=95%的置信信水平,那那么Z=1.996;或或者取
6、=999%,ZZ=2.68。然然后可以以确定容容许误差差d(或或者说精精度),即即我们可可以根据据实际情情况指定定置信区区间的半半宽度dd。因此此,公式式应用的的关键是是如何确确定总体体的标准准差S。如如果我们们可以估估计出总总体的方方差(标标准差),那那么我们们可以根根据公式式计算出出样本量量。比如如,要了了解某城城市的居居民收入入,假定定我们知知道该市市居民收收入的标标准差为为10000,要要求的调调查误差差不超过过1000元,则则在955%的置置信水平平下,所所需的样样本量为为 即需要调调查的样样本量为为3855个。3最大大样本量量的讨论论以上公式式只是理理论上的的,在实实际调查查中确定
7、定合理的的样本量量,必须须考虑多多方面的的因素。首先,由由于人们们通常缺缺乏对标标准差的的感性认认识,因因此对标标准差的的估计往往往是比比较困难难的。总总体的标标准差是是1233, 还还是7665?如如果没有有一点对对样本的的先验知知识,那那么对标标准差的的估计是是不可能能的。好好在我们们通常能能对变量量的平均均值进行行估计,如如我们通通过历史史资料估估计该地地区目前前的年人人均收入入大致为为10,0000元,那那么根据据统计学学知识,我我们引入入变异系系数的概概念:变异系数数V=标标准差SS/平均均值X= 11因此,我我们知道道人均收收入的标标准差应应该小于于平均值值,就是是说标准准差应该该
8、在1000000以下。当当然,这这对于我我们确定定样本量量还不能能起太大大的作用用。如果我们们采用相相对误差差表述的的精度,我我们有 其中P表表示相对对误差根据上述述公式,我我们可以以计算在在相对误误差一定定的情况况下,所所需的最最大样本本量。以以下是在在置信程程度955%的水水平下,在在不同相相对误差差下的最最高样本本量:相对误差差1%2%3%4%5%10%20%样本量38411696044426882401115377385104通常,变变异系数数为1的的情况是是很少见见的,根根据本人人对市场场研究中中经常遇遇到的情情况,变变异系数数多在550%以以下,因因此,实实际所需需要的样样本量可可
9、以进一一步缩小小。对于比例例型变量量,在事事先缺乏乏对比例例的估计计时,我我们可以以采用最最保守的的估计法法,即pp=0.5,以以下是比比例p在在不同绝绝对误差差程度下下,所需需的最大大样本量量(955%置信信水平):p的绝对对误差0.0110.0220.0330.0440.0550.100所需最大大样本量量960442401110677601385964. 实实际调查查样本量量的确定定原则虽然我们们根据公公式可以以从理论论上确定定样本量量的上限限,但是是由于实实际工作作的经费费和时间间限制,使使用最大大样本量量的可能能性很小小。而且且,实际际研究的的情况通通常要复复杂得多多,一项项研究往往往
10、要考考虑多个个目标,即即要求对对多个指指标的误误差进行行控制,而而不是简简单地考考虑一个个指标。因因此我们们在实际际的市场场研究中中,必须须综合考考虑,采采用多种种方式来来确定样样本量。(1)调调查的主主要目标标一个现实实的市场场调查往往往有多多个目标标,对于于一些目目标单一一的调查查,调查查的样本本量往往往可以很很少,比比如1000个,甚甚至500个就足足够了。而而对于具具有多个个目标的的研究,必必须考虑虑这些目目标中变变异程度度最大,要要求精度度最高的的目标。(2)分分类比较较的程度度分类是市市场研究究中一个个最基本本的方法法,研究究者往往往是通过过分类来来发现细细分市场场,确定定产品的的
11、市场定定位等。假假定对同同一变量量(研究究目标),在在一定精精度与置置信程度度下,只只要1000个样样本量就就足够了了,如果果我们仅仅仅希望望了解不不同性别别的消费费者市场场,则确确定样本本量时只只需要考考虑两类类消费者者的样本本量,这这样调查查的总样样本量可可能需要要2000个以上上,如果果希望了了解不同同年龄层层的消费费者,则则可能要要将消费费者分为为多类,如如分为:20岁岁以下,220-335,335-550,550岁以以上等四四类,这这样的样样本量需需要4000个以以上。也也就是说说,确定定样本量量时必须须考虑到到每一类类别的样样本量。(3)调调查区域域的大小小根据常识识,调查查区域越
12、越大,所所需要的的样本量量可能越越大,因因为大区区域内的的样本变变异程度度通常较较难掌握握。此外外,在实实际研究究中,我我们还往往往需要要对大区区域进行行进一步步分类,以以寻求更更加准确确的市场场细分。比比如,对对柯达胶胶卷进行行的调研研在北京京的取样样明显应应高于太太原。三、山西西联通市市场调研研的抽样样设计分分配表山西联通通是中国国联合通通信集团团公司的的全资子子公司,负负责经营营山西省省各地市市的综合合电信业业务。该该公司十十分注重重市场调调查,对对市场调调研的精精度和深深度都有有一定的的要求。220033年6月月实施的的山西省省联通用用户综合合业务调调研中,样样本的设设计具有有一定的的
13、科学性性。本文文给出了了本次调调查计划划中全省省范围市市场调查查的样本本配置方方案,以以资参阅阅。设p为本本次调查查总体的的任一比比例值, 为其估估计值,要要求 则样本大大小n可可以计算算如下:误差d置信度11-样本大小小n误差d置信度11-样本大小小n0.0770.9001380.0330.9550.9660.9770.9880.99910677117221308815099184220.0660.9001880.0550.9550.9660.9770.9880.9993854224715436630.0220.9550.9660.9770.9880.99924011263772946633
14、933414550.0040.9550.9660.9770.9880.999601660736849103660.0110.9550.9660.9770.9880.99996044105448117773135773165777假设在995%的的概率保保证下,最最大误差差不超过过2%,可可取的一一个样本本方案是是24001。我我们考虑虑到山西西省各地地市人口口数量的的差异,采采用比例例配置法法把全部部样本依依照比例例分摊到到各个地地市。结结果如下下表:地区人口(万万人)人口比例例样本数nn修正样本本数m太原市2930000000.09949114166227227大同市2690000000.0
15、8871339622209209阳泉市1220000000.0339522057794138长治市3060000000.09991225366238238晋城市2060000000.06667331455160160朔州市1320000000.04427559966102138忻州市2820000000.09913550833219219离石市3280000000.10062552022255255晋中市2960000000.09958885977230230临汾市3840000000.12243992611298298运城市4690000000.15519227444364364308770
16、000012401124766我们注意意到,阳阳泉市和和朔州市市的样本本均在1138以以下,也也就是说说,这两两个地市市的抽样样精度还还达不到到90%的置信信度,而而最大误误差则超超过了77%。因因此,我我们对这这两个地地市的样样本数量量进行修修正,均均提高到到1388,以满满足各个个地市调调查数据据可以独独立的要要求,此此时,两两个地市市的抽样样概率置置信度都都达到了了90%,最大大误差控控制在77%以下下。调整整以后的的样本列列在表的的最右边边一列。这这时,样样本总数数达到了了24776个。注 记: 1通通过对方方差的估估计,采采用公式式计算所所需样本本量,主主要采用用两步抽抽样,即即在调
17、查查前先抽抽取少量量的样本本,得到到标准差差S的估估计,然然后代入入公式中中,得到到下一步步抽样所所需样本本量n;如果有有以前类类似调查查的数据据,可以以使用以以前调查查的方差差作为总总体方差差的估计计。2. 根根据经验验,确定定样本量量的主要要方法有有:如果以前前有人做做过类似似的研究究,初学学者可以以参照前前人的样样本。如果是大大型城市市、省市市一级的的地区性性研究,样样本数在在5000-10000之之间可能能比较适适合;而而对于中中小城市市,样本本量在2200-3000之间可可能比较较适合;如果是是多省市市或者全全国性的的研究,则则样本量量可能在在10000-330000之间比比较适合合。3作为为一个常常识(主主要是为为了显著著性检验验),要要进行分分组研究究的每组组样本量量应该不不少于330个。4通过过调研设设计所作作的研究究,可以以采用较较小的样样本量。如如产品试试用(留留置)调调查,在在经费有有限的情情况下,可可以将每每组的样样本量降降低至115个左左右,最最好每组组在300以上。此此外,我我们在多多次的实实际研究究中发现现,每组组样本超超过500个可能能是一种种资源浪浪费