《市场调查数据的整理学习教案.pptx》由会员分享,可在线阅读,更多相关《市场调查数据的整理学习教案.pptx(39页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、市场市场(shchng)调查数据的整理调查数据的整理第一页,共39页。2 2学习(xux)内容1.1.数据整理的内容和程序2.2.统计分组 3.3.频数(pn sh)分布 第1页/共38页第二页,共39页。3 3/38/38一、数据(shj)整理的内容和程序 1 1)统计)统计(tngj)(tngj)资料的审核。资料的审核。2 2)资料的分组和汇总。分组,即对资料按其性质和特点,)资料的分组和汇总。分组,即对资料按其性质和特点,划分为若干类;汇总,加总计算形成各项统计划分为若干类;汇总,加总计算形成各项统计(tngj)(tngj)指标。统计指标。统计(tngj)(tngj)分组和统计分组和统计
2、(tngj)(tngj)汇总是整理的汇总是整理的中心工作。中心工作。3 3)编制统计)编制统计(tngj)(tngj)表或绘制统计表或绘制统计(tngj)(tngj)图。图。4 4)统计)统计(tngj)(tngj)资料的积累、保管和公布。资料的积累、保管和公布。第2页/共38页第三页,共39页。4 4/38/38统计资料的审核(shnh)识别虚假的问卷识别错误的信息剔除不一致、不充分(chngfn)或不相关的回答第3页/共38页第四页,共39页。5 5/38/38 二、统计(tngj)分组(一)统计分组的概念与种类(一)统计分组的概念与种类1 1、统计分组、统计分组1 1)根据统计研究的目的
3、和客观现象的内在特点,)根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究的总体划按某个标志(或几个标志)把被研究的总体划分为若干个不同性质分为若干个不同性质(xngzh)(xngzh)的组,称为统计的组,称为统计分组。分组。2 2)分组的性质)分组的性质(xngzh)(xngzh)来:兼有分和合双重含来:兼有分和合双重含义。义。第4页/共38页第五页,共39页。6 6/38/382 2、统计分组的原则、统计分组的原则穷尽原则,使总体中的每一个穷尽原则,使总体中的每一个(y)(y)单位都单位都应有组可归,或者说各分组的空间足以容应有组可归,或者说各分组的空间足以容纳总体所
4、有的单位。纳总体所有的单位。互斥原则,在特定的分组标志下,总体中的任互斥原则,在特定的分组标志下,总体中的任何一个何一个(y)(y)单位的只能归属于某一组,单位的只能归属于某一组,而不能同时或可能归属于几个组。而不能同时或可能归属于几个组。第5页/共38页第六页,共39页。7 7/38/383、统计(tngj)分组的种类1 1)按分组标志的多少,可分为简单分组和复合分组。)按分组标志的多少,可分为简单分组和复合分组。简单分组:就是对研究现象按一个标志进行分组。简单分组:就是对研究现象按一个标志进行分组。复合分组:用两个或两个以上标志分组,即先按一个复合分组:用两个或两个以上标志分组,即先按一个
5、标志分组,在此基础上再按第二个标志分小组,又再标志分组,在此基础上再按第二个标志分小组,又再层叠地按第三个标志分成层叠地按第三个标志分成(fn chn)(fn chn)更小的组,这更小的组,这称为复合分组。称为复合分组。第6页/共38页第七页,共39页。8 8/38/38国内生产总值(复合(fh)分组)第一产业三次产业第一产业三次产业 第二产业第二产业 工业行业工业行业(hngy)(hngy)国有工业经济类型国有工业经济类型 非国有工业非国有工业 建筑业建筑业 第三产业第三产业第7页/共38页第八页,共39页。9 9/38/38统计(tngj)分组的种类2 2)按分组的标志的性质不同,分为)按
6、分组的标志的性质不同,分为(fn wi)(fn wi)品质分组(或称属性分组)和数量分组或称变品质分组(或称属性分组)和数量分组或称变量分组)。量分组)。品质分组:按品质(或属性)标志进行分组。品质分组:按品质(或属性)标志进行分组。品质分组所形成的数列称为品质数列。品质分组所形成的数列称为品质数列。数量分组:按数量标志分组,数量标志的变异数量分组:按数量标志分组,数量标志的变异性体现在它不断变动自身的数量上,故也称为性体现在它不断变动自身的数量上,故也称为变量分组。变量分组所形成的数列称为变量数变量分组。变量分组所形成的数列称为变量数列。列。第8页/共38页第九页,共39页。1010/38/
7、38统计(tngj)分组的种类3 3)按分组的作用和任务不同,分为)按分组的作用和任务不同,分为(fn wi)(fn wi)类类型分组、结构分组和分析分组。型分组、结构分组和分析分组。类型分组:把复杂的现象总体,划分为类型分组:把复杂的现象总体,划分为(fn(fn wi)wi)若干个不同性质的部分,就是类型分组。若干个不同性质的部分,就是类型分组。结构分组:在对总体分组的基础上计算出各组结构分组:在对总体分组的基础上计算出各组对总体的比重,借此研究总体各部分的结构,对总体的比重,借此研究总体各部分的结构,即结构分组。即结构分组。分析分组:为研究现象之间依存关系而进行的分析分组:为研究现象之间依
8、存关系而进行的统计分组即分析分组。统计分组即分析分组。第9页/共38页第十页,共39页。1111/38/38类型类型(lixng)(lixng)分组分组我国全社会消费品零售额国有及国有控股商业零售额集体(jt)商业零售额私营及个体商业零售额和其他类型商业零售额第10页/共38页第十一页,共39页。1212/38/38(二)统计(tngj)分组的方法1 1、品质分组的方法。、品质分组的方法。按品质标志分组,分组比较简单,分组标志一经确定,按品质标志分组,分组比较简单,分组标志一经确定,组的名称和组数随之确定。组的名称和组数随之确定。例如,人口按性别分为男女两组。有些品质分组还取决例如,人口按性别
9、分为男女两组。有些品质分组还取决于统计分析对分组层次的不同要求,例如,我国把社会于统计分析对分组层次的不同要求,例如,我国把社会经济经济(jngj)(jngj)各部门划分为第一产业、第二产业和第三各部门划分为第一产业、第二产业和第三产业,第一产业还可细分为农业、林业、畜牧业和渔业产业,第一产业还可细分为农业、林业、畜牧业和渔业等等 。第11页/共38页第十二页,共39页。1313/38/38(二)统计(tngj)分组的方法2 2、数量分组的方法、数量分组的方法按数量标志分组,应注意按数量标志分组,应注意(zh y)(zh y)如下两个问题:如下两个问题:首先,分组时各组数量界限的确定必须能反映
10、首先,分组时各组数量界限的确定必须能反映事物质的差别。事物质的差别。其次,应根据被研究的现象总体的数量特征,其次,应根据被研究的现象总体的数量特征,采用适当的分组形式,确定相宜的组距、组限。采用适当的分组形式,确定相宜的组距、组限。第12页/共38页第十三页,共39页。1414/38/381)单项式分组与组距式分组A)A)单项式分组:用一个变量值作为一组,形成单项式单项式分组:用一个变量值作为一组,形成单项式变量数列。变量数列。变量值又称标志值。按数量标志分组,数量标志的表变量值又称标志值。按数量标志分组,数量标志的表现,就是变量的取值现,就是变量的取值单项式分组一般适用于离散型变量且变量变动
11、范围不单项式分组一般适用于离散型变量且变量变动范围不大的场合大的场合(chng h)(chng h)。例如,育龄妇女按其生育子女的存活数分组,可分为例如,育龄妇女按其生育子女的存活数分组,可分为0 0个、个、1 1个、个、2 2个、个、3 3个、个、4 4个、个、5 5个等个等6 6组。组。如表如表1 1所示:所示:第13页/共38页第十四页,共39页。1515/38/38按生育个数分组(按生育个数分组(x)频数(频数(fi)05112831141157647以上以上3合计合计50表表1 1 旧社会育龄妇女生育子女旧社会育龄妇女生育子女(zn)(zn)存活个数存活个数 单位:个单位:个第14页
12、/共38页第十五页,共39页。1616/38/38B)B)组距式分组:将变量依次划分为几段区间,组距式分组:将变量依次划分为几段区间,一段区间表现为一段区间表现为“从从到到”距离,把一段区距离,把一段区间内的所有变量值归为一组,形成组距式变量间内的所有变量值归为一组,形成组距式变量数列。区间的距离就是组距。数列。区间的距离就是组距。连续型变量或者变动范围较大的离散型变量,连续型变量或者变动范围较大的离散型变量,适宜采用组距式分组。适宜采用组距式分组。例如,反映例如,反映(fnyng)(fnyng)居民居住水平情况按人均居民居住水平情况按人均居住面积分组分为:居住面积分组分为:6 6平方米以下,
13、平方米以下,6 61010平方平方米,米,10101414平方米,平方米,1414平方米以上等平方米以上等4 4组。如组。如表表2 2 第15页/共38页第十六页,共39页。1717/38/38按人均居住面积分组(按人均居住面积分组(x)频数(频数(fi)6以下以下5610110148141811182211222672630430以上以上3合计合计50表表2 2 人均居住面积人均居住面积(j zh min j)(j zh min j)单位:平方米单位:平方米/人人第16页/共38页第十七页,共39页。1818/38/38B)组距式分组:下限(xixin),上限:组距式分组的每一组变量值中,其
14、最小值为下限(xixin),最大值为上限。8090组距:上下限(xixin)之间的距离。组限:相邻两组的界限。第17页/共38页第十八页,共39页。1919/38/382 2)间断)间断(jindun)(jindun)(连续)组距式分组(连续)组距式分组间断组距式分组:组限不相连的组距式分组。间断组距式分组:组限不相连的组距式分组。连续组距式分组:组限相连,即以同一数值作为相邻两连续组距式分组:组限相连,即以同一数值作为相邻两组的共同界限的组距式分组。组的共同界限的组距式分组。离散型变量,两种分组都可以。连续型变量,只能采用离散型变量,两种分组都可以。连续型变量,只能采用(ciyng)(ciy
15、ng)连续组距式分组。连续组距式分组。“上限在不内上限在不内”原则:在连续组距式分组中,以同一个原则:在连续组距式分组中,以同一个数值作为相邻两组共同的界限,统计上规定,凡是总数值作为相邻两组共同的界限,统计上规定,凡是总体某一个单位的变量值是相邻两组的界限值,这一个体某一个单位的变量值是相邻两组的界限值,这一个单位归入作为下限值的那一组内。单位归入作为下限值的那一组内。第18页/共38页第十九页,共39页。2020/38/38按人均居住面积分组(按人均居住面积分组(x)频数(频数(fi)6以下以下5710111148151811192211232672730431以上以上3合计合计50表表2
16、 2 人均居住面积人均居住面积(j zh min j)(j zh min j)单位:平方米单位:平方米/人人间断间断(jindun)组距分组组距分组第19页/共38页第二十页,共39页。2121/38/38按人均居住面积分组(按人均居住面积分组(x)频数(频数(fi)6以下以下5610110148141811182211222672630430以上以上3合计合计50表表2 2 人均居住面积人均居住面积(j zh min j)(j zh min j)单位:平方米单位:平方米/人人连续连续(linx)组距分组组距分组第20页/共38页第二十一页,共39页。2222/38/383)等距分组与异距分组
17、等距分组标志值在各组保持相等(xingdng)的组距,即各组的标志值变动都限于相同的范围。一般用于标志值变动比较均匀的场合。异距分组各组的组距不相等(xingdng)。第21页/共38页第二十二页,共39页。2323/38/38(三)相关(xinggun)指标的计算1.组距连续式分组的组距计算公式:组距=本组上限本组下限间断(jindun)式分组的组距计算公式:组距=本组上限本组下限+1开口组的组距:以相邻组的组距为本组的组距。第22页/共38页第二十三页,共39页。2424/38/382.2.组中值:上下限之间的中点数值称组中值:上下限之间的中点数值称为组中值,组中值的计算为组中值,组中值的
18、计算(j sun)(j sun)公式:公式:计算计算(j sun)(j sun)平均指标或进行其它统平均指标或进行其它统计分析时,常以组中值来代表各组计分析时,常以组中值来代表各组标志值的平均水平。标志值的平均水平。第23页/共38页第二十四页,共39页。2525/38/383.组数组数组数=全距全距/组距组距斯特杰斯经验斯特杰斯经验(jngyn)(jngyn)公式:公式:组数组数=1+3.3 Lg N=1+3.3 Lg N 由此推出由此推出组距组距=(最大变量值(最大变量值-最小变量值)最小变量值)/(1+3.3Lg N 1+3.3Lg N)第24页/共38页第二十五页,共39页。2626/
19、38/38N15242544458990179180359n56789组数cont.l l根据这一公式,可以得出如下(见表根据这一公式,可以得出如下(见表2-12-1)的组数参)的组数参考考(cnko)(cnko)标准:标准:第25页/共38页第二十六页,共39页。2727/38/38三 频数(pn sh)分布(一)频数分布的基本概念(一)频数分布的基本概念1 1、频数分布、频数分布在统计分组的基础上,将总体所有的单位按某在统计分组的基础上,将总体所有的单位按某一标志进行归类排列,称为频数分布,或一标志进行归类排列,称为频数分布,或次数分布。根据分组标志特征的不同,分次数分布。根据分组标志特征
20、的不同,分布数列可分为品质布数列可分为品质(pnzh)(pnzh)分布数列和变分布数列和变量分布数列。量分布数列。第26页/共38页第二十七页,共39页。2828/38/38频数(pn sh)分布的基本概念cont.2、分布数列的两个要素(yo s)1)总体按某标志分组。2)各组所出现的单位数,即频数,亦称次数。对于变量数列,标志值形成的数列,称为变量,一般用 x 表示;频数(次数)用 f 表示。第27页/共38页第二十八页,共39页。2929/38/38(二)变量数列(shli)的编制ex.对产品生产过程进行质量控制,抽取对产品生产过程进行质量控制,抽取50个电子元件调查个电子元件调查(di
21、o ch)其耐用时数(单位:小时),具体资料如下:其耐用时数(单位:小时),具体资料如下:11801010123011001180158012101460117010801050110010701370120016301250136012701420800103087011501410117012301260138015101010860810113011401190126013509301420108088010501250116013201380131012501270 对上述对上述(shngsh)资料采用等距分组,分为资料采用等距分组,分为8组,组距为组,组距为100,以,以800为第一
22、组下限。经过整理,得出计算结果如表为第一组下限。经过整理,得出计算结果如表2-2所示。所示。第28页/共38页第二十九页,共39页。3030/38/38表表2 22 502 50个电子元件耐用时数资料表个电子元件耐用时数资料表 单位单位(dnwi)(dnwi):小时:小时 按耐用时数分组(按耐用时数分组(x)频数(频数(fi)频率频率80090050.10900100010.021000110080.1611001200110.2212001300110.221300140070.141400150040.081500以上以上30.06合计合计501.00第29页/共38页第三十页,共39页。
23、3131/38/38(三)累计频数(pn sh)与累计频率1 1、向上累计频数(或频率)分布:先列出各组的上限,然、向上累计频数(或频率)分布:先列出各组的上限,然后由标志值低的组向标志值高的组依次累计。向上累计后由标志值低的组向标志值高的组依次累计。向上累计频数表明频数表明(biomng)(biomng)某组上限以下的各组单位数之和是某组上限以下的各组单位数之和是多少,向上累计频率表明多少,向上累计频率表明(biomng)(biomng)某组上限以下的各某组上限以下的各组单位数之和占总体单位数比重的大小。组单位数之和占总体单位数比重的大小。2 2、向下累计频数(或频率)分布:先列出各组的下限
24、,然、向下累计频数(或频率)分布:先列出各组的下限,然后由标志值高的组向标志值低的组依次累计。向下累计后由标志值高的组向标志值低的组依次累计。向下累计频数表明频数表明(biomng)(biomng)某组下限以上的各组单位数之和是某组下限以上的各组单位数之和是多少,向下累计频率表明多少,向下累计频率表明(biomng)(biomng)某组下限以上的各某组下限以上的各组单位数之和占总体单位数比重的大小。组单位数之和占总体单位数比重的大小。第30页/共38页第三十一页,共39页。3232/38/385050个电子元件耐用个电子元件耐用(niyng)(niyng)时数累计表时数累计表 向上累计向上累计
25、向下累计向下累计电子元件电子元件耐用时数耐用时数分组上限分组上限频频数数累计累计频数频数频率频率(%)累计频累计频率率(%)电子元件电子元件耐用时数耐用时数分组下限分组下限频频数数累计频累计频数数频率频率(%)累计频累计频率率(%)9005510108005501010010001621290014529011008141628100084416881200112522501100113622721300113622721200112522501400743148613007141428150044789414004781416002494981500234617001502100160011
26、22合计合计50100合计合计50100第31页/共38页第三十二页,共39页。3333/38/38累计分布累计分布(fnb)(fnb)特点特点3 3、累计频数分布特点、累计频数分布特点1 1)第一组的累计频数等于第一组本身的频数;)第一组的累计频数等于第一组本身的频数;2 2)最后一组累计频数等于总体)最后一组累计频数等于总体(zngt)(zngt)单位单位数。数。累计频率同样也具有两个特点:累计频率同样也具有两个特点:1 1)第一组的累计频率等于第一组本身的频率;)第一组的累计频率等于第一组本身的频率;2 2)最后一组的累计频率等于)最后一组的累计频率等于1 1。第32页/共38页第三十三
27、页,共39页。3434/38/38累计(li j)分布图 累计频数(频率)分布图分为向上累计频数(频率)分布累计频数(频率)分布图分为向上累计频数(频率)分布图和向下累计频数(频率)分布图。以分组变量为横轴,图和向下累计频数(频率)分布图。以分组变量为横轴,以累计频数(频率)为纵轴。以累计频数(频率)为纵轴。在直角坐标在直角坐标(zubio)(zubio)点系上将各组组距的上限与其相应点系上将各组组距的上限与其相应的累计频数(频率)所构成坐标的累计频数(频率)所构成坐标(zubio)(zubio)点,依次用直点,依次用直线(或光滑曲线)相连,即是向上累计曲线。线(或光滑曲线)相连,即是向上累计
28、曲线。在直角坐标在直角坐标(zubio)(zubio)系上将各组组距下限与其相应累计系上将各组组距下限与其相应累计频数(频率)所构成坐标频数(频率)所构成坐标(zubio)(zubio)点,依次用直线(或点,依次用直线(或光滑曲线)相连,即是向下累计分布曲线图。光滑曲线)相连,即是向下累计分布曲线图。第33页/共38页第三十四页,共39页。3535/38/38第34页/共38页第三十五页,共39页。3636/38/38第35页/共38页第三十六页,共39页。3737/38/38EXCEL在频数(pn sh)分布中的运用组限频数向上累积%向下累计299.912.00%100.00%399.91532.00%98.00%499.92174.00%68.00%599.91094.00%26.00%699.93100.00%6.00%第36页/共38页第三十七页,共39页。3838/38/38结结 束束第37页/共38页第三十八页,共39页。3939/38/38感谢您的观看感谢您的观看(gunkn)。第38页/共38页第三十九页,共39页。