《市场调查的数据分析课件.pptx》由会员分享,可在线阅读,更多相关《市场调查的数据分析课件.pptx(66页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、5.1 市场调查数据分析的基本方法频数、频率分析数据集中趋势分析 算术平均数 中位数 众数数据分散趋势分析 全距(极差)四分位差 标准差第1页/共66页5.1.1 频数、频率分析(1)例1:假设有样本数据ABCDEFGHIJ112214653322611223254334413314335413456424635352112114662634551322763662365118415336463495132522262103252341445第2页/共66页 5.1.1 频数、频率分析(2)第3页/共66页5.1.1 频数、频率分析(3)第4页/共66页5.1.2 算术平均数未分组数据的平均数
2、计算分组数据的平均数计算上例的计算结果第5页/共66页5.1.3 中位数的计算(1)未分组数据的中位数计算 对所有数据进行排序,当数据量为奇数时,取中间数为中位数,当数据量为偶数时,取最中间两位数的平均数为中位数。上例中数据量为100,是偶数,所以应取排序后第50位数和第51位数的平均值作为中位数。第50位数是3,第51位数也是3,所以中位数为3。第6页/共66页5.1.3 中位数的计算(2)分组数据的中位数计算 下式中L为中位数所在组的下限值,fm为中位数所在组的组频数,Sm-1为至中位数组时累计总频数,h为组距。第7页/共66页5.1.3 中位数的计算(3)例2:假设有分组数据如下(销售额
3、单位为万元)年销售额组中值商店数目累计频数80-90853390-10095710100-1101051323110-120115528120-130125230合计30第8页/共66页5.1.3 中位数的计算(4)依据公式例2的中位数为第9页/共66页5.1.4 众数的计算未分组数据的众数为出现次数最多的数。分组数据的众数依据下式计算获得。表达式中1表示众数所在组与前一组的频数差,2表示众数所在组与后一组的频数差。依据公式,例2分组数据的众数为104.29万元。第10页/共66页5.1.5 全距(极差)的计算全距指的是样本数据中最大值与最小值之间的距离,因而也叫极差。例1中最小值为1,最大值
4、为6,因而全距为6-1=5。第11页/共66页5.1.6 四分位差的计算四分位差是一种按照位置来测定数据离散趋势的计量方法,它只取决于位于样本排序后中间50%位置内数据的差异程度。即第一个四分位与第三个四分位数据之间的差异。例2的四分位差计算过程如下第12页/共66页5.1.7 标准差的计算(1)未分组数据的标准差计算第13页/共66页5.1.7 标准差的计算(2)分组数据的标准差的计算第14页/共66页5.2 市场调查数据的假设检验参数假设检验 U检验 t检验非参数检验第15页/共66页5.2.1 U检验当样本容量大于30时,可以采用U检验。均值检验 百分比检验 双样本平均数差异的检验 双样
5、本百分比差异的检验第16页/共66页均 值 检 验(U)假设有选取统计量设定显著性水平 查表得到根据U的计算结果,比较U的绝对值与 的大小。若有 则接受H0,否则拒绝H0。第17页/共66页百 分 比 检 验(U)假设有选取统计量设定显著性水平 查表得到根据U的计算结果,比较U的绝对值与 的大小。若有 则接受H0,否则拒绝H0。第18页/共66页双样本平均数差异的检验(U)假设有选取统计量设定显著性水平 查表得到根据U的计算结果,比较U的绝对值与 的大小。若有 则接受H0,否则拒绝H0。第19页/共66页双样本百分比差异的检验(U)假设有选取统计量设定显著性水平 查表得到根据U的计算结果,比较
6、U的绝对值与 的大小。若有 则接受H0,否则拒绝H0。第20页/共66页5.2.2 t检验当样本容量小于30时,不可以使用U检验,而需要使用t检验。均值检验 均值差异的检验 百分比差异的检验第21页/共66页均 值 检 验(t)假设有选取统计量设定显著性水平 查表得到根据t的计算结果,比较t的绝对值与 的大小。若有 则接受H0,否则拒绝H0。第22页/共66页均值差异的检验(t)假设有选取统计量设定显著性水平 查表得到根据t的计算结果,比较t的绝对值与 的大小。若有 则接受H0,否则拒绝H0。第23页/共66页百分比差异的检验(t)假设有选取统计量设定显著性水平 查表得到根据t的计算结果,比较
7、t的绝对值与 的大小。若有 则接受H0,否则拒绝H0。第24页/共66页5.2.3 非参数检验(X2)在市场调查中常获得一些量表数据,对量表数据求取平均数与方差都是毫无意义的。对量表数据的处理更适宜于采用非参数检验方法。非参数检验中常用的方法是X2检验。X2检验的统计量是 上述统计量中,表示第 类别在样本中实际出现的次数,表示期望出现的次数,为类别数。第25页/共66页5.3 市场调查的方差分析单因素方差分析双因素方差分析第26页/共66页5.3.1 单因素方差分析(1)单因素方差分析研究一个因素在不同水平下对研究对象影响的显著性。单因素方差分析的数据表如下:试验数试验水平A1A2An12M平
8、均值第27页/共66页5.3.1 单因素方差分析(2)单因素方差分析的一般形式方差来源平方和自由度方差F组间方差组内方差方差总和第28页/共66页5.3.1 单因素方差分析(3)单因素方差分析的数学计算表达式第29页/共66页5.3.1 单因素方差分析(4)例试验点月销售量(吨)包装1包装2包装3115151921010123912164511165161217合计556080第30页/共66页5.3.1 单因素方差分析(5)第31页/共66页5.3.1 单因素方差分析(6)查表求得 的值。比较 与 的大小。若有 ,则认为因素无显著性影响。反之则认为影响较显著。本例中n=3,m=5。第32页/
9、共66页5.3.2 双因素方差分析(1)双因素方差分析分析两个同时存在的因素在不同水平状态下独立作用对分析对象的影响的显著性。双因素分析的常用数据表因 素 A行总计观察值A1A2As因素BB1B2Br列总计第33页/共66页5.3.2 双因素方差分析(2)双因素方差分析表方差来源平方和自由度方差F因素A因素B误差总计第34页/共66页5.3.2 双因素方差分析(3)双因素方差分析的数学表达式第35页/共66页5.3.2 双因素方差分析(4)例销 地销 量行总计包装A1包装A2包装A3B120192160B216151445B39101130B487621列总计535152156(总)第36页/
10、共66页5.3.2 双因素方差分析(5)第37页/共66页5.3.2 双因素方差分析(6)第38页/共66页5.3.2 双因素方差分析(7)查表求得 的值。比较 与 、的大小。若有 ,则认为因素A无显著性影响;反之则认为影响较显著。若有 ,则认为因素B无显著性影响;反之则认为影响较显著。第39页/共66页5.4 因子聚类分析距离聚类法 最短距离法 最长距离法相关系数聚类法第40页/共66页5.4.1 最短距离聚类法(1)计算样本间距离,并列出初始距离矩阵。选取初始距离矩阵中的最小值,并对该值对应的样本进行类合并。根据最小值原则计算新合并样本与其他样本之间的距离,列出新的距离矩阵。重复上述步骤,
11、直至所有样本被全部合并为一类。第41页/共66页5.4.1 最短距离聚类法(2)例假设有样本数据如下,请对样本进行分类。样本序号样本式样样本包装样本性能14442366363342455122第42页/共66页5.4.1 最短距离聚类法(3)初始距离矩阵 第43页/共66页5.4.1 最短距离聚类法(4)第44页/共66页5.4.2 最长距离聚类法(1)计算样本间距离,并列出初始距离矩阵。选取初始距离矩阵中的最小值,并对该值对应的样本进行类合并。根据最大值原则计算新合并样本与其他样本之间的距离,列出新的距离矩阵。重复上述步骤,直至所有样本被全部合并为一类。第45页/共66页5.4.2 最长距离
12、聚类法(2)同上例初始距离矩阵第46页/共66页5.4.2 最长距离聚类法(3)第47页/共66页5.4.3 相关系数聚类法(1)被聚类的对象 、的相关系数可以由下式计算获得第48页/共66页5.4.3 相关系数聚类法(2)样本相关系数表X1X2X3X4X5X6X7X1-0.530.470.380.680.530.64X20.53-0.600.480.650.700.42X30.470.60-0.670.570.440.52X40.380.480.67-0.360.780.50X50.680.650.570.36-0.590.62X60.520.700.440.780.59-0.52X70.6
13、40.420.520.500.620.52-第49页/共66页5.4.3 相关系数聚类法(3)找出每列中最大的相关系数X1X2X3X4X5X6X7X1-0.530.470.380.680.530.64X20.53-0.600.480.650.700.42X30.470.60-0.670.570.440.52X40.380.480.67-0.360.780.50X50.680.650.570.36-0.590.62X60.520.700.440.780.59-0.52X70.640.420.520.500.620.52-第50页/共66页5.4.3 相关系数聚类法(4)找出各列最大相关系数中的最
14、大值X1X2X3X4X5X6X7X1-0.680.64X2-X3-X40.67-0.78X50.68-X60.700.78-X7-第51页/共66页5.4.3 相关系数聚类法(5)合并X2、X3、X4、X6。重复上述步骤,合并X1、X5、X7。X1X5X7X1-0.680.64X50.68-0.62X70.640.62-第52页/共66页5.5 因子判别分析判别分析法的目的是判别给定样本是否属于假定的类型。判别分析法的核心是建立判别函数。常用的判别函数为多元线性判别函数。其形式如下第53页/共66页5.5.1 判别函数的建立(1)例 假设有下列原始数据,请建立判别函数,判别假定的分组是否正确。
15、产品各指标表相应评价值产品款式X1产品包装X2产品性能X3预定销售组A1987210743763464558666855预定销售组B75368243914510452第54页/共66页5.5.1 判别函数的建立(2)第一步:计算A、B两组相应指标数据平均值第55页/共66页5.5.1 判别函数的建立(3)第二步:计算组间平均值的差。即有第56页/共66页5.5.1 判别函数的建立(4)第三步:计算A、B两组资料的离差矩阵。第57页/共66页5.5.1 判别函数的建立(5)第四步:计算离差矩阵CA、CB的共变异矩阵。第58页/共66页5.5.1 判别函数的建立(6)第五步:计算A、B两组资料的联
16、合共变异矩阵。第59页/共66页5.5.1 判别函数的建立(7)第六步:求联合共变异矩阵U的逆矩阵U-1。第60页/共66页5.5.1 判别函数的建立(8)第七步:求判别方程的系数b。第61页/共66页5.5.1 判别函数的建立(9)第八步:根据上述系数矩阵建立判别函数。根据判别表达式可知:产品款式对分组判别的影响最为显著,产品包装其次,而产品的性能对判别的影响不显著。第62页/共66页5.5.1 判别函数的建立(10)第九步:求判别函数Yc临界值。第63页/共66页5.5.1 判别函数的建立(11)第十步:判别分组的正确性。预分组别判别值实际组别预估准确性A2.4800A正确A2.6416A正确A1.8846A正确A1.6199A正确A2.1690A正确A2.1239A正确B1.3687B正确B0.6393B正确B0.4334B正确B1.1276B正确第64页/共66页5.5.1 判别函数的建立(12)第十一步:判别检验。故接受原假设。第65页/共66页感谢您的观看。第66页/共66页