《市场调查资料处理(共17页).doc》由会员分享,可在线阅读,更多相关《市场调查资料处理(共17页).doc(17页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上第6章 市场调查资料整理市场调查资料整理是对市场调查获得的信息进行初加工,为分析研究准备数据。本章主要阐述市场调查资料加工整理的基本知识和基本方法,主要包括审核、分类、编码、汇总、列表、图示等资料整理的技术性知识, 并重点阐述原始数据和历史数据加工开发的思路。 教学目的和要求1、 了解市场调查资料整理的基本内容。2、 掌握原始资料加工开发的具体方法。3、 掌握次级资料加工整理的程序和方法。4、 掌握市场调查资料表现的两种方法,即统计图和统计表。 教学重点和难点1、本章重点是原始资料、次级资料的加工、开发及整理;统计表和统计图的制作。2、本章难点是次级资料的加工整理及运
2、用相应软件在电脑上绘制统计表和统计图。 课时分配 本章2课时。节 次节 目课 时第一节第二节市场调查资料整理概述原始资料加工开发1第三节第四节次级资料加工整理市场调查资料陈示1总 计2教学内容6.1 市场调查资料整理概述6.1.1 市场调查资料整理的含义市场调查资料整理是根据市场分析研究的需要,对市场调查获得的大量的原始资料进行审核,分组、汇总、列表,或对二手资料进行再加工的工作过程。其任务在于使市场调查资料综合化、系列化、层次化,为揭示和描述调查现象的特征、问题和原因提供初步加工的信息,为进一步的分析研究准备数据。6.1.2 市场调查资料整理的内容资料整理的基本内容包括以下三个方面。1 数据
3、确认:是指对原始数据或二手资料进行审核,查找问题、采取补救措施、确保数据质量。2数据处理:是指对问卷或调查表提供的原始数据进行分类和汇总,或者对二手数据进行再分类和调整。3数据陈示:是指对加工整理后的数据用统计表、统计图、数据库、数据报告等形式表现出来。6.1.3 市场调查资料整理的原则1目的性原则:有针对性的加工开发。2核查性原则:注意事前、事中和事后的核查。3系统化原则:实行多方向、多层次的加工开发。4时效性原则:提高加工整理的效率,及时加工处理、传输和反馈。6.1.4 市场调查资料整理的程序1设计整理方案2审核、订正调查资料3分组处理4统计汇总5数据陈示6.2 原始资料加工开发原始资料加
4、工开发的基本程序。问卷或调查表资料审核分组处理统计汇总手工汇总计算机汇总数据陈示程序设计数据编码数据录入逻辑检查汇总计算属性水准数量水准空间水准时间水准关联水准折叠法划记法卡片法问卷分类法齐备性完整性准确性真伪性 6.2.1 原始资料的审核1 审核的内容(1)齐备性。检查收回的问卷或调查表的分数是否齐全,是否达到了样本量的要求。(2)完整性。检查审核问卷或调查表填答的项目是否完整。并视不同情形作出处理。大量问项无回答应作废卷处理。个别问项个别无回答,归入“暂未决定”或“其他答案”中。个别问项大量无回答,可作删除此项提问。(3)准确性。检查问卷或调查表中的项目是否存在填答错误。逻辑性错误答案,用
5、电话核实或按“不详值”对待;答非所问的答案,用电话询问或按“不详值”对待;乏兴回答答案,若个别问卷则抛弃,若同一问题有不少问卷乏兴回答可作子样本看待。(4)时效性。检查调查访问时间和数据的时效性。若延迟访问对调查结果无影响,则问卷有效;若延迟访有影响,则废弃此问卷(5)真伪性。检验问卷或调查表的真实性。抽样复检访问员是否到访,若访问员伪造问卷应作废弃处理,并重新派员重访。2 审核的作业方式实行一卷或一表从头审到尾,有利于贯彻审核的一致性原则和明确审核员的责任,而分段作业和分段审核,但不利于贯彻一致性原则,容易产生责任不清的问题。3 审核的办法(1)逻辑审核。利用逻辑和经验判断的方法,检查问卷或
6、调查表中的填答项目是否合理,项目之间有无相互矛盾的地方,有无不应有的空白,有没有不合理的填答,有没有泛兴填答、答非所问或部分项目不回答等。(2)计算审核。计算审核主要是对数据进行计算性的检查,如分量相加是否等于小计,小计相加是否等于合计,数据之间该平衡的是否平衡,各项数据在计算方法、计算口径、计量单位、时间属性等方面是否有误等。6.2.2 原始资料的分组处理1 简单分组处理是指对总体各单位或样本各单位只按一个标志或标准进行分组处理。分组的标志或标准一般可以区分为品质属性、数量属性、时间属性、空间属性四类。例如:某市组织了一次样本量为2000户的居民家庭空调满意度和购买行为的市场调查,设计的问项
7、是36个,其中基本项目9项,主体项目27项。(一)基本项目1、性别2、年龄3、文化程度4、职业5、所属行业6、家庭人口7、就业人口8、年人均收入9、居住城区(二)空调拥有状况10、拥有量 11、品牌 12、机型 13、功率 14、购买时间15、购买地点16、购买因素17、信息渠道18、价格 (三)满意度项目19、制冷效果20、制热效果21、需电效果22、噪声大小23、外观设计24、组件质量25、价格水平26、送货安装27、维修服务(四)需求项目28、需求数量29、需求时间30、品牌选择31、机型选择32、功率选择33、价位选择34、购点选择35、关注要素36、由谁决定1) 品质属性分布数列。是
8、以被调查者的职业、所属行业、性别、文化程度、职业等品质属性作为分组标志而形成的简单品质数列。如表6-1表6-1 某市居民家庭空调拥有量品牌分布品牌ABCDEFG合计拥有量(台)比重(%)36911.766521.177524.644414.140612.92618.32307.33 150100.02)数量属性分布数列。是以被调查者的年龄、收入、消费支出、家庭人口、就业人口等数量属性作为分组标志形成的变量数列。有如下两种形式:(1)单项式变量数列。适应于离散型变量(如家庭人口、就业人口、耐用品拥有量、需求量等)的分组处理,即直接以变量的不同取值作组别而编制的变量数列。如表6-2。表6-2 某市
9、居民家庭空调拥有台数分布拥有量(台)012345台以上合计家庭数(户)比重(%)30015.070835.464632.327413.7522.6201.02 000100.0(2)组距式变量数列。适应于连续变量(如年龄、收入、消费支出等)的分组处理,即以变量的不同取值区间作为分组的组别而编制的变量数列,如表6-3表6-3 某市居民家庭人均年收入分布组 别样本户数(户)比重(%)0.5万以下0.5-11-22-33-44-55万元以上1802203205003602601609.011.016.025.018.013.08.0合 计2 000100.03)时间属性分布数列是以调查问卷中的一些时
10、间属性的调查项目(如购买时间、需求时间)作为分组标志,对被调查者的时间选项进行分组而形成的时间数列。如表6-4表6-4 某市居民家庭现有空调购买时间分布购买年数1年2年3年4年5年6年6年以上合计空调数(台)比重(%)65220.759218.155117.551316.347915.23109.8531.73150100.04)空间属性分布数列是以调查问卷中的某些具有空间属性的调查项目(如被调查者的居住区域、购买产品的场所等)作为分组标志而形成的空间数列。如表6-5。表6-5 某市居民家庭现有空调购买场所分布购买场所百货、超市空调专卖店电器城厂家直销旧货市场合计家庭(户)比重(%)54732
11、.255432.653431.4482.8171.01 700100.02 平行分组处理平行分组处理是对总体各单位或样本各单位同时采用两个或两个以上的标志或标准进行平行排列的分组,所编制的分组数列称为平行分组数列。(1)两变量(项目)平行分组数列。它是将两个有联系的调查项目按相同选项分组的结果并列在一起而编制的平行分组数列。如表6-6。表6-6 某市居民家庭空调品牌分布品牌ABCDEFG合计1、拥有量(台)比重(%)2、需求量(台)比重(%)36911. 710312.166521.119222.677524.618321.644414.114016.540612.911013.02618.3
12、688.02307.3526.23150100.0848100.0(2)多变量(多项目)平行分组数列。这是将两个以上有联系的调查项目按相同选项分组的结果并列在一起而编制的平行分组数列。常用于产品或服务满意度测评、被调查者态度测量等原始资料的加工开发。如表6-7。6-7 某市居民家庭空调满意度测评汇总表测评项目很满意满意较满意不满意很不满意次数合计1、制冷效果2、制热效果3、节电效果4、噪声大小5、外观设计6、产品价格7、配件质量8、送货安装9、维修服务261272272115202212981201203283303302303243962832862866865145146808607266
13、066986953403863863652302853903243268519819831084813232722731 7001 7001 7001 7001 7001 7001 7001 7001 7003 交叉分组处理交叉分组处理是对总体各单位或样本各单位采用两个或两个以上的标志或调查项目进行交叉分组,所编制的数列一般表现为相关分组数列或复合分组数列。(1)基本项目之间的交叉分组处理。它是利用反映被调查者基本情况的基本调查项目之间的关联性进行交叉分组处理。如表6-8 6-8 被调查者性别与文化程度分布 单位:人 性别文化程度男女合计小学以下初中高中高职专科大学本科硕士博士62102972
14、48226484176321265177221038661851340370合 计1 0359652 000(2)基本项目与主体项目之间的交叉分组处理。它是利用问卷中的基本项目与主体项目之间的关联性进行交叉分组处理,用以揭示不同性别、不同年龄、不同行业、不同职业、不同文化程度、不同居住区域、不同家庭人口的被调查者对所要研究的主体项目选项回答的差异性、相关性等深层次的问题。如表6-9两变量交叉列表。6-9 某市居民人均年收入与品牌需求交叉分组列表品牌需求人均年收入ABCDEFG合计0.5万以下10158102418850.5-143228181420161321-2660562818168192
15、2-31448433026451703-42636302516231384-52846161412715万元以上25251512160合 计1031921831401106852848(3)三变量交叉列表。如表6-10。表6-10 被调查者对空调维修服务满意度测评汇总表态度测评选项男女合计大学以下大学以上小计大学以下大学以上小计很满意较满意一般不满意很不满意13512612419618011648524612251174176242192124141136170195409546135164236182183200415410358425392合计7612741 0357661999652 0
16、004开发式问题的分类归纳“意见分类归纳法”的基本思路和程序。(1)集中所有同一个开放式问题的全部文字性答案,通过阅读、思考和分析,把握被调查者的思想认识。(2)将被调查者的全部文字性答案,按照其思想认识不同归纳为若干类型,并计算各种类型出现的频数;制成全部答案分布表。(3)对全部答案分布表中的答案进行挑选归并,确定可以接受的分组数。一般来说,应在符合调研项目的前提下,保留频数多的答案,然后把频数很少的答案尽可能归并到含义相近的组,应考虑调研的目的和答案类型的多少而确定,一般来说应控制在10组之内。(4)为确定的分组,选择正式的描述词汇或短语。不同组别的描述词汇或短语应体现质的差别,力求中肯、
17、精炼、概括。(5)根据分类归纳的结果,制成正式的答案分布表。例如,在一项关于居民空调购买行为的调研中,问卷中,设置了“你对静音空调这个产品概念有何看法?”的开放式问项,被调查者的回答是多种多样的,通过分类归纳得到的答案分布表如表6-11。表6-11 被调查者对“静音空调”的看法分布看法分类答案人数比重(%)符合环保需求符合发展趋势符合消费需求希望尽快推出有可能实现不可能实现难以评价32528631619831235021316.2514.3015.809.9015.6017.5010.65合 计2 000100.00原始资料加工开发的框架调查问卷单变量数列(n+m)个交叉分组处理开放式项目(r
18、项)基本项目(n项)简单分组处理平行分组处理分类归纳处理主体项目(m项)双变量交叉数列n(n-1)/2+(nm)个三变量交叉数列(选择加工)平行分组数列(选择加工)意见分布数列(r个) 6.2.3 原始资料的统计汇总原始资料的统计汇总技术有如下两类。1 计算机汇总技术(1)选用或开发合适的数据处理软件(2)编码事前编码(预编码):问卷设计是问项答案的代码事后编码:开放式问题的答案整理编码。交叉分组处理编码。平行分组处理编码。(3)数据录入一般是由数据录入员根据编码的规则(编码明细单)将数据从调查问卷上直接录入到计算机数据录入软件系统中,系统会自动进行记录和存储。(4)逻辑检查运用事先设计的计算
19、机逻辑错误检查程序进行检查,以防止录入的逻辑错误的产生。(5)汇总制表利用设定的计算机汇总与制表程序、自动生成各种分组表2 手工汇总技术(1)问卷分类法。将全部问卷按照问项设计的顺序和分组处理的要求,依次对问项答案进行问卷分类,分别清点有关问卷的份数,就可得到各个问题答案的选答次数。(2)折叠法。将全部调查问卷中的同一问项及答案折叠起来,并一张一张地叠在一起,用别针或回形针别好,然后计点各个答案选择的次数,填入事先设计的分组表内。(3)划记法。事先设计好空白的分组统计表,然后对所有问卷中的相同问项的不同答案一份一份地进行查看,并用划记法划记(常用“正”),全部问卷查看与划记完毕,即可统计出相同
20、问项下的不同答案的次数,最后过录到正式的分组统计表上。(4)卡片法。利用摘录卡做为记录工具,对开放式问题的回答或深层访谈的回答进行过录或记录,然后再依据这些卡片进行“意见归纳处理”。6.3 次级资料加工整理6.3.1 次级资料加工整理程序次级资料确 认评 价加 工整 理真假性、准确性时效性、可靠性可直接利用的、需加工处理的调整法、推算法、再分组法制表、归类、汇编、归档6.3.2 历史数据的整序与开发历史数据的多方向开发,是从不同的角度对同一统计指标的依时间取值进行加工开发,为分析研究提供多样化、序列化的动态数据。按其取值的属性不同,可分别加工开发出以下六类时间数列。1品质属性时间数列指对统计指
21、标按品质属性分组并依时间先后顺序取值而编制的时间数列。表6-12某空调生产厂家不同产品的近六年的国内销售量统计。表6-12 某空调厂近六年分品种的产品销售量 单位:万台年份品种2002200320042005200620071P挂机1.5挂机一拖二挂二拖三挂2P柜机2P以上柜机10.223.522.314.420.817.011.826.424.616.122.117.513.129.327.818.2220319.415.332.430.220.025.420.118.136.634.822.027.122.020.442.840.224.633.122.4合 计108.2118.5130.
22、1143.4160.6183.52数量属性时间数列是指对统计指标按数量属性分组,并依时间先后顺序取值而编制的时间数列。例如表6-13某空调厂近三年全部客户按空调购买量分组的时间数列。表6-13 某空调厂近三年全部客户分类统计客户订购量分组2005年2006年2007年客户数订购量客户数订购量客户数订购量0.5万台以下0.5-1.01.0-1.51.5-2.02.0-5.05-10.010万台以上50161595438.211.518.815.113.534.242.1531815106538.612.618.916.816.142.744.9582016117549.214.520.218.5
23、19.243.058.9合 计102143.4107160.6121183.53空间属性时间数列是指对统计指标按空间属性列出不同的地区(或部门、行业),并将不同年份或月份的数据排列起来而编制的时间数列。例如表6-14某空调厂近六年分省的空调销售量分布。表6-14 某空调厂近六年空调分省销售量分布 单位:万台 省别编号20022003200420052006200701020304050607080932.321.611.48.39.66.17.45.85.732.823.411.88.610.46.58.69.27.235.425.812.18.611.37.09.412.018.537.82
24、7.313.28.712.37.310.417.68.840.231.116.68.813.88.012.520.78.951.635.418.88.613.48.215.523.28.8合计108.2118.5130.1143.4160.6183.54季节属性时间数列季节属性时间数列是指对统计指标按月份、月季取值,并按年度顺序排序起来的时间数列。可以研究现象发展变化的趋势和淡旺季变化规律。如表6-15某空调厂近六年分季度的空调销售量的时间数列。6-15 某空调厂近六年分季空调销售量统计 单位:万台年份1季度2季度3季度4季度全年20022003200420052006200711.914.2
25、15.016.218.520.228.431.433.638.042.447.737.842.745.150.557.264.830.130.236.438.742.550.8108.2118.5130.1143.4160.6183.55平衡属性时间数列是指将具有收支平衡关系的若干统计指标的分年度(或分季、分月)的统计数据排列起来而编制的时间数列。如表6-16,某空调厂近六年的空调产销统计。 表6-16 某空调厂近六年空调产销统计 单位:万台年份年初存量当年生产量当年销售量当年出口量其它支出年末存量20022003200420052006200713.413.812.114.014.813.6
26、136.1144.8167.6188.3212.9246.6108.2118.5130.1143.4160.6183.527.528.035.644.153.564.613.812.114.014.813.612.16相关属性时间数列是将某一重要的统计指标与企业内部或外部的一些有关联的其他性质的统计指标的数据分年(季、月)或分地区、分单位组织起来而编制的时间数列。如表6-17某空调厂与全行业的产品产量、销售总量的相关数列。表6-17 某空调厂与全行业空调产销统计 单位:万台项目2002200320042005200620071全行业生产量本厂生产量2全行业销售量本厂销售量1 337.6 136
27、.11 333.5 135.71 826.7 144.81 820.0 146.52 333.6 167.62 330.1 165.73 135.1 188.33 131.4 187.53 433.8 212.93 430.6 214.14 110.3 246.64 108.6 248.1历史数据的整序与开发必须注意以下几点:一是数据收集和初加工等基础性工作必须扎实,有充分的数据资源可供利用;二是必须选择重要的统计指标或变量进行历史数据的多方向开发;三是应利用数据库技术进行历史数据的有效组织和开发。6.4 市场调查资料陈示6.4.1 统计表统计表是以纵横交叉的线条所绘制表格来陈示数据的一种形式
28、。用统计表陈示数据资料有两大优点:一是能有条理地、系统地排列数据,使人们阅读时一目了然,印象深刻,二是能合理地、科学地组织数据,便于人们阅读时对照比较。统计表从形式上看,是由总标题、横行标题、纵栏标题、指标数值四个部分构成。如表6-18所示。总标题:统计表的名称,概括统计表的内容,写在表的上端中部。横行标题:横行的名称,即各组的名称,写在表的左方。纵栏标题:纵栏的名称,即指标或变量的名称,写在表的上方。指标数值:列在横行标题和纵栏标题交叉对应处。6-18 婚姻、性别与时装购买选择分布表时装购买选择男 性女 性小计已婚未婚小计已婚未婚高档时装中档时装低档时装1712191301251641014
29、655291692031087513590946818被调查者人数520390130480300180统计表从内容上看,由主词或宾词两大部分构成。主词是统计表所要说明的总体的各个构成部分或组别的名称,列在横行标题的位置。宾词是统计表所要说明的统计指标或变量的名称和数值,宾词中的指标名称列在纵栏标题的位置。有时为了编排的合理和使用的方便,主词和宾词的位置可以互换。6.4.2 统计图统计图是以圆点的多少、直线长短、曲线起伏、条形长短、柱状高低、圆饼面积、体积大小、实物形象大小或多少、地图分布等图形来陈示调研数据。用统计图陈示调研数据具有“一图抵千字”的表达效果,因为图形能给人以深刻而明确的印象,能
30、揭示现象发展变化的结构、趋势、相互关系和变化规律、便利表达、宣传、讲演、广告和辅助统计分析。但统计图能包含的统计项目较少,且只能显示出调查数据的概数,故统计图常配合统计表、市场调研报告使用。1直线图直线图是以直线的长短来表示品质属性数列中各组频数或频率大小的图形。常以横轴代表品质属性的不同组别,纵轴代表各组的频数或频率。ABCDEFG5.010.015.020.025.030.0频率%品牌0.0 图6-4 居民空调拥有量品牌分布2条形图是以若干等宽平行长条或圆柱的长短来表示品质属性数列中各组频数或频率大小的图形。通常以横轴代表不同的组别,纵横代表各组的频数或频率,有时亦可用纵轴代表各组,横轴代
31、表频数或频率 图6-5 消费者对变频空调的看法3圆面图是以圆形的面积代表总体指标数值,圆形的各扇形面积代表各组指标数值,或将圆形面积分为若干角度不同的扇形,分别代表各组的频率。实际应用时亦可将圆面改为圆饼或圆台,变成圆形立体图。4环形图环形图是将总体或样本中的每一部分数据用环形中的一段表示。环形图亦可同时绘制多个总体或样本的数据系列。每一个总体或样本的数据系列为一个环。5直方图直方图是以若干等宽的直方长条的长短来表示各组的频数或频率的大小。常用于表现组距数列的次数分布或频率分布。离散型变量组距的直方图中的长条应间断,连续变量组距数列的直方图中的长条应连接起来。频率(%)(%)302520155
32、 0.5 1 2 3 4 5 6 万元/人 图6-8 某市居民家庭年人均可支配收入分布6动态条形图动态条形图是以宽度相等的条形的长短或高低来比较不同时期的统计数据的大小的图形,用以显示现象发展变化的过程和趋势。动态条形排列可以是纵列(垂直条形图),也可以是横列(水平或带状条形图),按图形中涉及的统计指标或变量的多少不同,可分为单式条形图、复式条形图、分段条形图等。7动态曲线图动态曲线图又称时间数列曲线图或历史曲线图,它是以曲线的升降、起伏来表示数据的动态变化。按涉及指标的多少,有单式曲线图和复式曲线图之分。8相关散点图相关散点图主要用于显示因变量(y)与自变量(x)之间是否具有相关关系,以及相
33、关关系的形式是直线相关还是曲线相关,是正相关还是负相关。通常以横轴代表自变量(x),纵轴代表因变量(y)。y9统计地图统计地图是以地图为底本,利用点、线条、面积、数据、象形、标志等来表现各区域某种统计指标数据的大小及其在地理上的分布情形,又称空间数列图。根据所利用的图形不同,统计地图可分为数据地图、点地图、面地图、象形地图、线路地图、标志地图等等。图6-13是某市居民购房的区域选择分布地图。 东区28.1% 北区 南区9.8% 30.2% 西区21.4%市中心10.5% 图6-13 某市居民购房区域选择10茎叶图茎叶图又称枝叶图,是一种将数据与图形结合使用的表现数据的方式。特别适合于描述变量数
34、列的次数分配。由茎和叶两部分构成,茎一般为十位或百位数,叶为个位数,因而图形是由数字组成的茎叶图类似于横置的直方图,同时保留了原始数据的信息。图6-14是某厂40个客户产品订购量(台)分布茎叶图。图6-15 某厂产品销售客户ABC分类图11帕累托图帕累托图主要用来描述财富分配、库存物资、客户分布、产品销售等分布不均匀的现象。一般是将所研究的现象分为ABC三类,A类的单位数占10-20%,而指标值占70-80%;B类的单位数占20-25%,而指标值占15-20%,C类单位数占60-65%,而指标值占5-10%。然后依然累计频率进行制图。表6-15是某企业产品ABC销售分类的帕累托图。案例分析案例6-1 某市消费者空调购买行为调查数据分析提示:你认为此例调查数据加工处理有何特点,有哪些缺陷?实际工作中,应怎样弥补这些缺陷?根据这些数据,你认为可制作哪些形式的统计表和统计图?若再次作同类调查,你能设计出更为完善的调查问卷和数据整理方案吗?案例6-2某宾馆顾客满意度评估数据分析提示:次例调查数据加工处理有何特点,有哪些缺陷?应怎样弥补这些缺陷?你认为次例调查数据可划分为哪些评价构面? 要求列出各构面的数据统计表。专心-专注-专业