《多变量数据分析技术讲稿.ppt》由会员分享,可在线阅读,更多相关《多变量数据分析技术讲稿.ppt(54页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、多变量数据分析技术多变量数据分析技术第一页,讲稿共五十四页哦统计分析是正确理解数据的工具统计分析是正确理解数据的工具首先:要避免犯首先:要避免犯首先:要避免犯首先:要避免犯统计统计错误错误错误错误明确:明确:统计没有错误,犯错的是人。统计没有错误,犯错的是人。1.理论和方法的错误理论和方法的错误2.理解和解释的错误理解和解释的错误第二页,讲稿共五十四页哦变量:测量尺度变量:测量尺度 名称级名称级名称级名称级-定类变量定类变量定类变量定类变量 顺序级顺序级顺序级顺序级-定序变量定序变量定序变量定序变量 间隔级间隔级间隔级间隔级-定距变量定距变量定距变量定距变量 比例级比例级比例级比例级-定比变量
2、定比变量定比变量定比变量低低低低高高高高转转转转换换换换定性定性定性定性定量定量定量定量非数量型非数量型非数量型非数量型数量型数量型数量型数量型离散型随机变量离散型随机变量离散型随机变量离散型随机变量连续型随机变量连续型随机变量连续型随机变量连续型随机变量统计分析方法的应用有时候按变量的测量等级来划分。统计分析方法的应用有时候按变量的测量等级来划分。统计分析方法的应用有时候按变量的测量等级来划分。统计分析方法的应用有时候按变量的测量等级来划分。第三页,讲稿共五十四页哦=0=1均值标准差=0.025=0.0251-=0.9595%99%95%68%-1-2-3+1+2+3第四页,讲稿共五十四页哦
3、均值标准差=0.025=0.0251-=0.9595%99%95%68%-2-3+2+3第五页,讲稿共五十四页哦第六页,讲稿共五十四页哦第七页,讲稿共五十四页哦多变量统计分析法多变量统计分析法多变量统计分析法多变量统计分析法高级数据处理分析技术高级数据处理分析技术 多元回归分析多元回归分析多元回归分析多元回归分析 Multiple Regression AnalysisMultiple Regression Analysis 主成份分析主成份分析主成份分析主成份分析 Principal Component Analysis PCAPrincipal Component Analysis PCA
4、 因子分析因子分析因子分析因子分析 Factor Analysis FA(EFA&CFA)Factor Analysis FA(EFA&CFA)多元方差分析多元方差分析多元方差分析多元方差分析 ANOVAANOVA 多维判别分析多维判别分析多维判别分析多维判别分析 Multiple Discrimination AnalysisMultiple Discrimination Analysis 多维尺度分析多维尺度分析多维尺度分析多维尺度分析 Multidimensional Scaling MDS MDAMultidimensional Scaling MDS MDA 多元逻辑斯特回归多元逻辑
5、斯特回归多元逻辑斯特回归多元逻辑斯特回归 Multiple Logistic RegressionMultiple Logistic Regression 对应分析对应分析对应分析对应分析 Correspondence Analysis CACorrespondence Analysis CA 多元对应分析多元对应分析多元对应分析多元对应分析 Multiple Correspondence Analysis MCAMultiple Correspondence Analysis MCA 多维偏好分析多维偏好分析多维偏好分析多维偏好分析 Multidimensional Preference A
6、nalysis MDPREF Multidimensional Preference Analysis MDPREF 非线性主成份分析非线性主成份分析非线性主成份分析非线性主成份分析 (Optimal Scaling)Optimal Scaling)分类树分类树分类树分类树 AnswerTreeCHAID&CARTAnswerTreeCHAID&CART 聚类分析聚类分析聚类分析聚类分析 Cluster AnalysisCluster Analysis 结合分析结合分析结合分析结合分析 Conjoint AnalysisConjoint Analysis 离散选择模型离散选择模型离散选择模型离
7、散选择模型 Discrete Choice ModelDiscrete Choice Model 结构方程式模型结构方程式模型结构方程式模型结构方程式模型 Structural Equation Model Structural Equation Model 预测与决策模型预测与决策模型预测与决策模型预测与决策模型Decision Time&What ifDecision Time&What if 网络分析网络分析网络分析网络分析Network AnalysisNetwork Analysis第八页,讲稿共五十四页哦多元回归分析多元回归分析Multiple Regression Analysi
8、s通话质量通话质量特服台服务特服台服务技术支持技术支持/咨询咨询装机装机/修机修机/移机业务移机业务营业厅服务营业厅服务服务宣传项目服务宣传项目话费价格话费价格话费话费/查询查询/准确准确/缴费缴费投诉投诉/纠纷纠纷急需改进区急需改进区优势保持区优势保持区次要改进区次要改进区锦上添花区锦上添花区某省电信各项总体满意度指标的重要性和满意度象限图某省电信各项总体满意度指标的重要性和满意度象限图满意度水平(表现)满意度水平(表现)重重要要性性水水平平第九页,讲稿共五十四页哦第十页,讲稿共五十四页哦Y=a+bX因变量因变量因变量因变量自变量自变量自变量自变量(预测变量)预测变量)预测变量)预测变量)截
9、距截距截距截距斜率斜率斜率斜率数学上下列方程在图形上是一条直线数学上下列方程在图形上是一条直线第十一页,讲稿共五十四页哦XYX和和Y线性回归线性回归 dYi第十二页,讲稿共五十四页哦回归分析的问题回归分析的问题 决定系数决定系数决定系数决定系数R R2 2 方差分析表方差分析表方差分析表方差分析表 回归诊断回归诊断回归诊断回归诊断残差图残差图残差图残差图 共线性问题共线性问题共线性问题共线性问题 变量转换变量转换变量转换变量转换 异常值处理异常值处理异常值处理异常值处理 预测范围预测范围预测范围预测范围 因变量是因变量是因变量是因变量是0-10-1定类变量:定类变量:定类变量:定类变量:log
10、istic regressionlogistic regression第十三页,讲稿共五十四页哦Component PlotComponent 1.7.6.5.4.3Component 2.6.4.2-.0-.2-.4-.6接待投诉耐心处理投诉迅速维修专业程度维修服务态度维修及时程度广告吸引力广告投放量入网费打折促销对服务承诺的兑现情况维修服务收费通话费计费透明度通话费计费准确性通话费入网费营业员专业水平营业员服务态度营业厅规模营业厅环境销售网点分布开户手续网络覆盖服务和网络功能公司对各种承诺的兑现公司手机网络的用户量公司的技术力量对该公司将来的信心公司信誉公司实力公司总体形象重要性水平重要性
11、水平重要性水平重要性水平表表现现主成份分析主成份分析主成份分析主成份分析 Principal Component Analysis PCAPrincipal Component Analysis PCA急需改进区急需改进区优势保持区优势保持区次要改进区次要改进区锦上添花区锦上添花区某移动通讯服务供应省满意度指标的重要性和满意度象限图某移动通讯服务供应省满意度指标的重要性和满意度象限图第十四页,讲稿共五十四页哦主成份分析主成份分析主成份分析主成份分析 Principal Component Analysis PCAPrincipal Component Analysis PCA0-1-21230
12、-1-212-3第一主成份第一主成份第第二二主主成成份份沃尔沃沃尔沃沃尔沃沃尔沃奔驰奔驰奔驰奔驰BMWBMWBMWBMW切诺基切诺基切诺基切诺基桑塔纳桑塔纳桑塔纳桑塔纳捷达捷达捷达捷达富康富康富康富康红旗红旗红旗红旗奥迪奥迪奥迪奥迪别克别克别克别克现代现代现代现代本田本田本田本田丰田丰田丰田丰田赛欧赛欧赛欧赛欧第十五页,讲稿共五十四页哦主成份分析的基本概念主成份分析的基本概念x1x2Y1Y2x1x2X1与与x2相关相关Y1与与Y2不相关不相关第十六页,讲稿共五十四页哦主成份分析的基本原理主成份分析的基本原理 P P P P个变量能够组成个变量能够组成个变量能够组成个变量能够组成p p p p个
13、主成份。个主成份。个主成份。个主成份。每个主成份是每个主成份是每个主成份是每个主成份是p p p p个原始变量的线性组合。个原始变量的线性组合。个原始变量的线性组合。个原始变量的线性组合。第一主成份解释第一主成份解释第一主成份解释第一主成份解释p p p p个变量的最大变差。个变量的最大变差。个变量的最大变差。个变量的最大变差。第二主成份解释第二主成份解释第二主成份解释第二主成份解释p p p p个变量的第二大变差。个变量的第二大变差。个变量的第二大变差。个变量的第二大变差。最后一个主成份解释变差最小。最后一个主成份解释变差最小。最后一个主成份解释变差最小。最后一个主成份解释变差最小。所有主成
14、份彼此之间正交。所有主成份彼此之间正交。所有主成份彼此之间正交。所有主成份彼此之间正交。线性组合后的主成份在几何空间上代表线性组合后的主成份在几何空间上代表线性组合后的主成份在几何空间上代表线性组合后的主成份在几何空间上代表p p p p个变量构成坐标系旋转后的新坐标个变量构成坐标系旋转后的新坐标个变量构成坐标系旋转后的新坐标个变量构成坐标系旋转后的新坐标系,新坐标轴代表了最大变差方向。系,新坐标轴代表了最大变差方向。系,新坐标轴代表了最大变差方向。系,新坐标轴代表了最大变差方向。第十七页,讲稿共五十四页哦主成份分析应用主成份分析应用 减少变量的个数。减少变量的个数。减少变量的个数。减少变量的
15、个数。用于回归分析用于回归分析用于回归分析用于回归分析 用于聚类分析用于聚类分析用于聚类分析用于聚类分析 用于偏好分析用于偏好分析用于偏好分析用于偏好分析 用于画出偏好图用于画出偏好图用于画出偏好图用于画出偏好图 构造综合评价指数构造综合评价指数构造综合评价指数构造综合评价指数综合排序。综合排序。综合排序。综合排序。第十八页,讲稿共五十四页哦因子分析因子分析因子分析因子分析 Factor AnalysisFactor Analysis每升行驶里程每升行驶里程可靠性能可靠性能安全性能安全性能0-1-21230-1-212-3豪华型豪华型运动型运动型经济型经济型第一因子得分第一因子得分第一因子得分
16、第一因子得分第第第第二二二二因因因因子子子子得得得得分分分分第十九页,讲稿共五十四页哦因子分析因子分析-factor Analysis 一种简化数据的技术。一种简化数据的技术。一种简化数据的技术。一种简化数据的技术。探索性因子分析。探索性因子分析。探索性因子分析。探索性因子分析。证实性因子分析证实性因子分析证实性因子分析证实性因子分析 因子分析就是要找到具有本质意义的少量因子。因子分析就是要找到具有本质意义的少量因子。因子分析就是要找到具有本质意义的少量因子。因子分析就是要找到具有本质意义的少量因子。并用一定的结构并用一定的结构并用一定的结构并用一定的结构/模型,去表达或解释大量可观测的变量。
17、模型,去表达或解释大量可观测的变量。模型,去表达或解释大量可观测的变量。模型,去表达或解释大量可观测的变量。第二十页,讲稿共五十四页哦主要应用主要应用 简化数据,减维技术。简化数据,减维技术。简化数据,减维技术。简化数据,减维技术。识别数据中潜在的不正直接观测的结构或维度。识别数据中潜在的不正直接观测的结构或维度。识别数据中潜在的不正直接观测的结构或维度。识别数据中潜在的不正直接观测的结构或维度。用产生的不相关的因子作为变量用于其它分析用产生的不相关的因子作为变量用于其它分析用产生的不相关的因子作为变量用于其它分析用产生的不相关的因子作为变量用于其它分析聚类分析、聚类分析、聚类分析、聚类分析、
18、回归分析、判别分析等。回归分析、判别分析等。回归分析、判别分析等。回归分析、判别分析等。识别变量中重要变量,用于其它分析。识别变量中重要变量,用于其它分析。识别变量中重要变量,用于其它分析。识别变量中重要变量,用于其它分析。作偏好图。(两个因子)作偏好图。(两个因子)作偏好图。(两个因子)作偏好图。(两个因子)问卷设计的信度和效度。问卷设计的信度和效度。问卷设计的信度和效度。问卷设计的信度和效度。第二十一页,讲稿共五十四页哦因子分析的基本步骤因子分析的基本步骤1.1.1.1.确定研究的问题确定研究的问题确定研究的问题确定研究的问题2.2.2.2.数据准备数据准备数据准备数据准备3.3.3.3.
19、考察相关矩阵考察相关矩阵考察相关矩阵考察相关矩阵4.4.4.4.选择抽取因子的方法选择抽取因子的方法选择抽取因子的方法选择抽取因子的方法5.5.5.5.取定因子的个数取定因子的个数取定因子的个数取定因子的个数6.6.6.6.旋转因子旋转因子旋转因子旋转因子最大方差法最大方差法最大方差法最大方差法7.7.7.7.评价模型的拟合效果评价模型的拟合效果评价模型的拟合效果评价模型的拟合效果8.8.8.8.解释因子并命名解释因子并命名解释因子并命名解释因子并命名9.9.9.9.因子得分因子得分因子得分因子得分10.10.10.10.用于其它分析用于其它分析用于其它分析用于其它分析第二十二页,讲稿共五十四
20、页哦多维偏好分析多维偏好分析多维偏好分析多维偏好分析 Multidimensional Preference Analysis MDPREFMultidimensional Preference Analysis MDPREF每升行驶里程每升行驶里程可靠性能可靠性能安全性能安全性能0-1-21230-1-212-3第一主成份第一主成份第一主成份第一主成份第第第第二二二二主主主主成成成成份份份份豪华型豪华型运动型运动型经济型经济型沃尔沃奔驰BMW切诺基桑塔纳捷达富康红旗奥迪别克现代本田丰田赛欧第第第第二二二二因因因因子子子子得得得得分分分分第一因子得分第一因子得分第一因子得分第一因子得分第二十三
21、页,讲稿共五十四页哦理想点模型理想点模型理想点模型理想点模型每升行驶里程每升行驶里程可靠性能可靠性能安全性能安全性能0-1-21230-1-212-3第一主成份第一主成份第第二二主主成成份份豪华型豪华型运动型运动型经济型经济型沃尔沃奔驰BMW切诺基桑塔纳捷达富康红旗奥迪别克现代本田丰田赛欧第二因子得分第一因子得分理想点理想点理想点理想点帕萨特第二十四页,讲稿共五十四页哦Component 1Component 11.01.0.5.50.00.0-.5-.5-1.0-1.0Component 2Component 21.01.0.8.8.6.6.4.4.2.20.00.0-.2-.2-.4-.4
22、-.6-.6-.8-.8S25S25S24S24S23S23S22S22S21S21S20S20S19S19S18S18S17S17S16S16S15S15S14S14S13S13S12S12S11S11S10S10S9S9S8S8S7S7S6S6S5S5S4S4S3S3S2S2S1S1主成份分析主成份分析主成份分析主成份分析 Principal Component Analysis PCAPrincipal Component Analysis PCA市场细分市场细分市场细分市场细分第二十五页,讲稿共五十四页哦REGR factor score 1 for analysis 12.52.01
23、.51.0.50.0-.5-1.0-1.5REGR factor score 2 for analysis 13210-1-2奥迪奥迪A6宝来宝来别克别克富康富康波罗波罗POLO夏利夏利2000风神蓝鸟风神蓝鸟捷达捷达广州本田广州本田帕萨特帕萨特奥托奥托羚羊羚羊红旗铭仕红旗铭仕奇瑞奇瑞赛欧赛欧吉利吉利桑塔纳桑塔纳因子分析因子分析因子分析因子分析 Factor Analysis FA(EFA&CFA)Factor Analysis FA(EFA&CFA)市场细分市场细分市场细分市场细分第二十六页,讲稿共五十四页哦奥迪奥迪A6宝来宝来别克别克富康富康波罗波罗POLO夏利夏利2000风神蓝鸟风神蓝鸟
24、捷达捷达广州本田广州本田帕萨特帕萨特奥托奥托羚羊羚羊红旗铭仕红旗铭仕奇瑞奇瑞赛欧赛欧吉利吉利桑塔纳桑塔纳Component 11.0.50.0-.5-1.0Component 21.0.8.6.4.20.0-.2-.4-.6-.8S25S24S23S22S21S20S19S18S17S16S15S14S13S12S11S10S9S8S7S6S5S4S3S2S1产品定位图产品定位图产品定位图产品定位图第二十七页,讲稿共五十四页哦聚类分析聚类分析聚类分析聚类分析Cluster AnalysisCluster Analysis第二十八页,讲稿共五十四页哦Dendrogram using Averag
25、e Linkage(Between Groups)Dendrogram using Average Linkage(Between Groups)Rescaled Distance Cluster Combine Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 C A S E 0 5 10 15 20 25 Label Num +-+-+-+-+-+Label Num +-+-+-+-+-+桑塔纳桑塔纳桑塔纳桑塔纳 1 -+-+1 -+-+1 -+-+1 -+-+红旗铭仕红旗铭仕红旗铭仕红旗铭仕 10 -+-+10 -+-+1
26、0 -+-+10 -+-+捷达捷达捷达捷达 14 -+14 -+14 -+14 -+I I I I 吉利吉利吉利吉利 2 -+-+-+2 -+-+-+2 -+-+-+2 -+-+-+奥托奥托奥托奥托 7 -+7 -+7 -+7 -+I I II I II I II I I 奇瑞奇瑞奇瑞奇瑞 4 -+-+-+4 -+-+-+4 -+-+-+4 -+-+-+I I I I 富康富康富康富康 11 -+-+11 -+-+11 -+-+11 -+-+I II II II I 夏利夏利夏利夏利2000 12 -+-+2000 12 -+-+2000 12 -+-+2000 12 -+-+I I I II
27、 I I II I I II I I I 羚羊羚羊羚羊羚羊 13 -+-+-+13 -+-+-+13 -+-+-+13 -+-+-+I I I I 赛欧赛欧赛欧赛欧 3 -+-+3 -+-+3 -+-+3 -+-+I II II II I 波罗波罗波罗波罗POLO 5 -+I IPOLO 5 -+I IPOLO 5 -+I IPOLO 5 -+I I 宝来宝来宝来宝来 6 -+6 -+6 -+6 -+I I I I 别克别克别克别克 15 -+-+15 -+-+15 -+-+15 -+-+I I I I 风神蓝鸟风神蓝鸟风神蓝鸟风神蓝鸟 16 -+-+16 -+-+16 -+-+16 -+-+
28、I I I I 帕萨特帕萨特帕萨特帕萨特 8 -+-+-+8 -+-+-+8 -+-+-+8 -+-+-+广州本田广州本田广州本田广州本田 9 -+9 -+9 -+9 -+I I I I 奥迪奥迪奥迪奥迪A6 17 -+A6 17 -+A6 17 -+A6 17 -+谱系聚类分析和快速聚类谱系聚类分析和快速聚类谱系聚类分析和快速聚类谱系聚类分析和快速聚类HierarchicalHierarchical&K-Mean&K-Mean Cluster AnalysisCluster Analysis第二十九页,讲稿共五十四页哦聚类分析的基本概念聚类分析的基本概念l 聚类分析(cluster anal
29、ysis)顾名思义是一种分类的多元统计分析方法。l 按照个体或样品(individuals,objects or subjects)的特征将它们分类,使 同一类别内的个体具有尽可能高的同质性(homogeneity),而类别之间则应具 有尽可能高的异质性(heterogeneity)。l 也可以对变量分类,但是更常见的还是对个体分类。l 为了得到比较合理的分类,首先要采用适当的指标来定量地描述研究对象(样品 或变量,常用的是样品)之间的联系的紧密程度。l 常用的指标为“距离”和“相似系数”。l 假定研究对象均用所谓的“点”来表示。l 在聚类分析中,一般的规则是将“距离”较小的点或“相似系数”较
30、大的点归为同一 类,将“距离”较大的点或“相似系数”较小的点归为不同的类。第三十页,讲稿共五十四页哦l 需要一组表示个体性质或特征的变量,称之为分类变量。l 根据个体或样本之间联系的紧密程度进行分类。l 一般来说分类变量的组合都是由研究者规定的,不是像其它多元分析方 法那样估计推导出来的。l 聚类分析前所有个体或样品所属的类别是未知的,类别个数一般也是未 知的,分析的依据就是原始数据,没有任何事先的有关类别的信息可参考。l 严格说来聚类分析并不是纯粹的统计技术,它不像其它多元分析法那样,需 要从样本去推断总体。l 聚类分析一般都涉及不到有关统计量的分布,也不需要进行显著性检验。l 聚类分析更像
31、是一种建立假设的方法,而对假设的检验还需要借助其它 统计方法。聚类分析的基本概念聚类分析的基本概念第三十一页,讲稿共五十四页哦第三十二页,讲稿共五十四页哦Euclidean distance modelDimension 1210-1-2-3Dimension 21.51.0.50.0-.5-1.0-1.5-2.0北京申办2008年奥运会两岸关系中国能否加入世贸组织国营和集体企业改组、依法治国教育体制改革打假澳门回归行业不正之风土地承包政策不变乱收费农村脱贫致富水灾后重建农村村务公开、民主选举减轻农民负担反腐败环境保护亚洲金融危机会否波及人民币是否贬值养老保险社会治安下岗再就业物价涨跌医疗改革
32、住房货币化改革多维尺度分析多维尺度分析多维尺度分析多维尺度分析MDSMDS个人利益个人利益国家利益国家利益农民利益农民利益社会利益社会利益第三十三页,讲稿共五十四页哦对维尺度分析对维尺度分析对维尺度分析对维尺度分析 -Multidimensional ScalingMultidimensional Scaling 在市场研究领域主要研究消费者的态度,衡量消费者的知觉及偏好。涉及的研在市场研究领域主要研究消费者的态度,衡量消费者的知觉及偏好。涉及的研在市场研究领域主要研究消费者的态度,衡量消费者的知觉及偏好。涉及的研在市场研究领域主要研究消费者的态度,衡量消费者的知觉及偏好。涉及的研究对象非常广
33、泛,例如:汽车、洗头水、饮料、快餐食品、香烟和国家、企业品究对象非常广泛,例如:汽车、洗头水、饮料、快餐食品、香烟和国家、企业品究对象非常广泛,例如:汽车、洗头水、饮料、快餐食品、香烟和国家、企业品究对象非常广泛,例如:汽车、洗头水、饮料、快餐食品、香烟和国家、企业品牌、政党候选人等。通过牌、政党候选人等。通过牌、政党候选人等。通过牌、政党候选人等。通过MDSMDSMDSMDS分析能够为市场研究提供有关消费者的知觉和偏分析能够为市场研究提供有关消费者的知觉和偏分析能够为市场研究提供有关消费者的知觉和偏分析能够为市场研究提供有关消费者的知觉和偏好信息。好信息。好信息。好信息。主要借助计算机统计分
34、析软件,输入有关消费者对事物的知觉或偏好数据,主要借助计算机统计分析软件,输入有关消费者对事物的知觉或偏好数据,主要借助计算机统计分析软件,输入有关消费者对事物的知觉或偏好数据,主要借助计算机统计分析软件,输入有关消费者对事物的知觉或偏好数据,转换为一组对象或对象特征构成的多维空间知觉或偏好图转换为一组对象或对象特征构成的多维空间知觉或偏好图转换为一组对象或对象特征构成的多维空间知觉或偏好图转换为一组对象或对象特征构成的多维空间知觉或偏好图感知图。感知图。感知图。感知图。第三十四页,讲稿共五十四页哦 应用应用应用应用MDSMDS,收集的数据值大小必须能够反应两个研究对象的相似性或差异性程度。这
35、种收集的数据值大小必须能够反应两个研究对象的相似性或差异性程度。这种收集的数据值大小必须能够反应两个研究对象的相似性或差异性程度。这种收集的数据值大小必须能够反应两个研究对象的相似性或差异性程度。这种数据叫做邻近。数据叫做邻近。数据叫做邻近。数据叫做邻近。所有研究对象的邻近数据可以用一个邻近矩阵表示。所有研究对象的邻近数据可以用一个邻近矩阵表示。所有研究对象的邻近数据可以用一个邻近矩阵表示。所有研究对象的邻近数据可以用一个邻近矩阵表示。反映邻近的测量方式:反映邻近的测量方式:反映邻近的测量方式:反映邻近的测量方式:相似性相似性相似性相似性-数值越大对应着研究对象越相似。数值越大对应着研究对象越
36、相似。数值越大对应着研究对象越相似。数值越大对应着研究对象越相似。差异性差异性差异性差异性-数值越大对应着研究对象越不相似。数值越大对应着研究对象越不相似。数值越大对应着研究对象越不相似。数值越大对应着研究对象越不相似。两个地点(位置)之间的实际距离。(测量差异性)两个地点(位置)之间的实际距离。(测量差异性)两个地点(位置)之间的实际距离。(测量差异性)两个地点(位置)之间的实际距离。(测量差异性)两个产品之间相似性或差异性的消费者心理测量。两个产品之间相似性或差异性的消费者心理测量。两个产品之间相似性或差异性的消费者心理测量。两个产品之间相似性或差异性的消费者心理测量。两个变量的相关性测量
37、。(相关系数测量相似性)两个变量的相关性测量。(相关系数测量相似性)两个变量的相关性测量。(相关系数测量相似性)两个变量的相关性测量。(相关系数测量相似性)从一个对象过渡到另一个对象的转换概率。例如概率反应了消费者从一个对象过渡到另一个对象的转换概率。例如概率反应了消费者从一个对象过渡到另一个对象的转换概率。例如概率反应了消费者从一个对象过渡到另一个对象的转换概率。例如概率反应了消费者对品牌或产品偏好的变化。(测量相似性)对品牌或产品偏好的变化。(测量相似性)对品牌或产品偏好的变化。(测量相似性)对品牌或产品偏好的变化。(测量相似性)反映两种事物在一起的程度。例如:用早餐人们经常将两种食品搭配
38、在一反映两种事物在一起的程度。例如:用早餐人们经常将两种食品搭配在一反映两种事物在一起的程度。例如:用早餐人们经常将两种食品搭配在一反映两种事物在一起的程度。例如:用早餐人们经常将两种食品搭配在一起。(测量相似性起。(测量相似性起。(测量相似性起。(测量相似性)第三十五页,讲稿共五十四页哦多维判别分析多维判别分析多维判别分析多维判别分析 Multiple Discrimination Analysis MDAMultiple Discrimination Analysis MDA判别函数2判别函数1-1-21230-1-212-3价格水平交货速度产品质量销售力度价格弹性总体服务制造商形象新用户
39、新用户犹豫犹豫/转移用户转移用户重复购买用户重复购买用户第三十六页,讲稿共五十四页哦 判别分析是一种进行统计判别和分类的统计技术手段。它可以就一定数量的个体的一个分类变量和相应的其它多元变量的已知信息,确定分类变量与其它多元变量之间的数量关系,建立判别函数。利用这一数量关系对其他已知多元变量的信息、但未知分组的子类型的个体进行判别分组。市场细分研究中,常涉及判别个体所属类型的问题。也常涉及不同品牌在一组产品属性之间的消费者偏好和认知概念,判别分析可以很好地对这种差异进行鉴别。并在低维度空间表现这种差异。因变量(dependent variable):分组变量定性数据(个体、产品/品牌、特征)。
40、自变量(independent variable):判别变量定量数据(属性的评价得分)。判别分析判别分析第三十七页,讲稿共五十四页哦确定分组变量与判别变量间的关系确定分组变量与判别变量间的关系 建立判别函数,找到自变量的最佳区分因变量的各个类别的线性组和。也可以确定后验概率,计算每个个体落入各个类别的概率。确定哪些判别变量x1、x2、x3、xk对区分类别差异的影响最大。考察各个类别在判别变量方面是否存在显著差异。确定判别变量是以什么形式影响因变量的,即D是 x1 x2 x3 xk 什么形式的函数。根据判别变量的值对个体进行分类。对分析的准确程度进行评价。第三十八页,讲稿共五十四页哦-1.0-1
41、.0-0.5-0.50.00.00.50.51.01.0Dimension 1Dimension 1-1.5-1.5-1.0-1.0-0.5-0.50.00.00.50.51.01.0D Di imme en ns si io on n 2 2POISONPOISONGASGASHANGHANGDROWNDROWNGUNGUNJUMPJUMPM15M15M30M30M45M45M60M60M80M80F15F15F30F30F45F45F60F60F80F80第三十九页,讲稿共五十四页哦主要应用主要应用判别和细分市场判别和细分市场用户和非用户经常购买者和非经常购买者新用户、流失用户和忠实用户忠
42、诚用户和非忠诚用户新产品早期使用者和后期使用者消费者心目中喜欢的品牌和不喜欢的品牌消费者对我们的品牌和竞争品牌的不同属性偏好偏好图市场细分新产品开发第四十页,讲稿共五十四页哦ABCDEFG价格合理性价格合理性易于服用易于服用药效持久药效持久有效性有效性对儿童有益对儿童有益药性温和药性温和感冒药品概念图感冒药品概念图感冒药品概念图感冒药品概念图/品牌图品牌图品牌图品牌图第四十一页,讲稿共五十四页哦LogisticLogistic回归模型回归模型回归模型回归模型第四十二页,讲稿共五十四页哦逻辑斯特回归逻辑斯特回归 Logistic回归是一种进行统计判别和分类的统计技术手段。它可以就一定数量的个体的
43、一个二分变量(因变量)和相应的其它多个自变量(预测变量)的已知信息,确定二分变量与其它预测变量之间的数量关系,建立Logistic非线性回归方程。利用回归方程进行预测和解释,在其他已知多元变量的信息、但未知分组的个体进行判别分组。因变量(dependent variable):0-1变量 二分变量(个体、产品/品牌、特征)。自变量(independent variable):预测变量定量数据或定性(属性的评价得分)。市场细分研究中,常涉及判别个体所属类别是两个分类的问题。例如:是否该给某个人发信用卡,是否是用户,成功和失败,疾病的诊断等,Logistic 回归可以很好地对这种差异进行鉴别。第四
44、十三页,讲稿共五十四页哦.6.4.2.0-.2-.4-.6-.8-1.01.51.0.50.0-.5-1.0新疆宁夏青海甘肃陕西西藏云南贵州四川海南广西广东湖南湖北河南山东江西福建安徽浙江江苏上海黑龙江吉林辽宁内蒙山西河北天津北京200元以上元以上101-200元元51-100元元50元以下元以下南方区域南方区域南方区域南方区域北方区域北方区域北方区域北方区域话费高省话费高省话费高省话费高省话费低省话费低省话费低省话费低省固固固固定定定定电电电电话话话话话话话话费费费费不不不不同同同同省省省省分分分分布布布布情情情情况况况况对应分析对应分析对应分析对应分析 Correspondence Ana
45、lysisCorrespondence Analysis第四十四页,讲稿共五十四页哦对应分析的基本概念对应分析的基本概念 对应分析是一种数据分析技术,它能够帮助我们研究由定性变量构成的交互汇总表来对应分析是一种数据分析技术,它能够帮助我们研究由定性变量构成的交互汇总表来对应分析是一种数据分析技术,它能够帮助我们研究由定性变量构成的交互汇总表来对应分析是一种数据分析技术,它能够帮助我们研究由定性变量构成的交互汇总表来揭示变量间的联系。揭示变量间的联系。揭示变量间的联系。揭示变量间的联系。交互表的信息以图形的方式展示。交互表的信息以图形的方式展示。交互表的信息以图形的方式展示。交互表的信息以图形的
46、方式展示。是强有力的探索数据技术,主要适用于有多个类别的定类变量。是强有力的探索数据技术,主要适用于有多个类别的定类变量。是强有力的探索数据技术,主要适用于有多个类别的定类变量。是强有力的探索数据技术,主要适用于有多个类别的定类变量。可以揭示同一个变量的各个类别之间的差异,以及不同变量各个类别之间的对应可以揭示同一个变量的各个类别之间的差异,以及不同变量各个类别之间的对应可以揭示同一个变量的各个类别之间的差异,以及不同变量各个类别之间的对应可以揭示同一个变量的各个类别之间的差异,以及不同变量各个类别之间的对应关系。关系。关系。关系。适用于两个或多个定类变量。适用于两个或多个定类变量。适用于两个
47、或多个定类变量。适用于两个或多个定类变量。第四十五页,讲稿共五十四页哦2.01.51.0.50.0-.5-1.0-1.5-2.02.01.51.0.50.0-.5-1.046岁以上36-45岁26-35岁25岁以下无回答/无收入高收入中高收入中等收入中低收入低收入女性男性200元以上101-200元51-100元50元以下大学本科及以上大专高中/中专/技校初中小学及以下不使用不使用小灵通小灵通小灵通小灵通价格敏感性特征价格敏感性特征价格敏感性特征价格敏感性特征无消费欲望者特征无消费欲望者特征无消费欲望者特征无消费欲望者特征固定用户特征固定用户特征固定用户特征固定用户特征使用使用使用使用移动移动
48、移动移动通讯通讯通讯通讯服务服务服务服务消费消费消费消费者特者特者特者特征征征征SIM卡卡充值卡充值卡特殊需求者特征特殊需求者特征特殊需求者特征特殊需求者特征多元对应分析多元对应分析多元对应分析多元对应分析 Multiple Correspondence AnalysisMultiple Correspondence Analysis第四十六页,讲稿共五十四页哦对应分析对应分析对应分析对应分析 Correspondence Analysis CACorrespondence Analysis CA-1.5-1-0.500.511.52-1.5-1-0.500.511.5雪糕雪源清爽甘甜雪浪花洗
49、衣机兴奋波澜欢快个性空调碳酸饮料期望毛毯保健食品天山绿中美纯纯水纯净玉泉果汁饮料春溪安闲高档新产品名称(品牌)测试新产品名称(品牌)测试新产品名称(品牌)测试新产品名称(品牌)测试第四十七页,讲稿共五十四页哦第四十八页,讲稿共五十四页哦对应分析可以回答以下问题对应分析可以回答以下问题对应分析可以回答以下问题对应分析可以回答以下问题 谁是我的用户?谁是我的用户?谁是我的用户?谁是我的用户?还有谁是我的用户?还有谁是我的用户?还有谁是我的用户?还有谁是我的用户?谁是我竞争对手的用户?谁是我竞争对手的用户?谁是我竞争对手的用户?谁是我竞争对手的用户?相对于我的竞争对手的产品,我的产品的定位如何?相对
50、于我的竞争对手的产品,我的产品的定位如何?相对于我的竞争对手的产品,我的产品的定位如何?相对于我的竞争对手的产品,我的产品的定位如何?与竞争对手有何差异?与竞争对手有何差异?与竞争对手有何差异?与竞争对手有何差异?我还应该开发哪些新产品?我还应该开发哪些新产品?我还应该开发哪些新产品?我还应该开发哪些新产品?对于我的新产品,我应该将目标指向哪些消费者?对于我的新产品,我应该将目标指向哪些消费者?对于我的新产品,我应该将目标指向哪些消费者?对于我的新产品,我应该将目标指向哪些消费者?第四十九页,讲稿共五十四页哦Dimension 1Dimension 11.01.0.8.8.6.6.4.4.2.