《数据分析及数据挖掘.doc》由会员分享,可在线阅读,更多相关《数据分析及数据挖掘.doc(15页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、多元统计分析介绍1.因子分析(Factor Analysis) 因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因为它是不可观测的,即不是具体的变量),以较少的几个因子反映原资料的大部分信息。 运用这种研究技术,我们可以方便地找出影响消费者购买、消费以及满意度的主要因素是哪些,以及它们的影响力(权重)运用这种研究技术,我们还可以为市场细分做前期分析。2.主成分分析主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重
2、要的。主成分分析一般很少单独使用:a,了解数据。(screening the data),b,和cluster analysis一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简化。(reduce dimensionality)d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。主成分分析和因子分析的区别1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。 2、主成分分析的重点在于解释个变量的总方差,而因子分析则把重点放在解释各变量之间的协方差。
3、 3、主成分分析中不需要有假设(assumptions),因子分析则需要一些假设。因子分析的假设包括:各个共同因子之间不相关,特殊因子(specific factor)之间也不相关,共同因子和特殊因子之间也不相关。 4、主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,的主成分一般是独特的;而因子分析中因子不是独特的,可以旋转得到不同的因子。 5、在因子分析中,因子个数需要分析者指定(spss根据一定的条件自动设定,只要是特征值大于1的因子进入分析),而指定的因子数量不同而结果不同。在主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分。 和主成分分析相比,由于因子分
4、析可以使用旋转技术帮助解释因子,在解释方面更加有优势。大致说来,当需要寻找潜在的因子,并对这些因子进行解释的时候,更加倾向于使用因子分析,并且借助旋转技术帮助更好解释。而如果想把现有的变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主成分分析。当然,这中情况也可以使用因子得分做到。所以这中区分不是绝对的。 总得来说,主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单独使用:a,了解数据。(screening the data),b,和cluster
5、analysis一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简化。(reduce dimensionality)d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。 在算法上,主成分分析和因子分析很类似,不过,在因子分析中所采用的协方差矩阵的对角元素不在是变量的方差,而是和变量对应的共同度(变量方差中被各因子所解释的部分)。 3.聚类分析(Cluster Analysis)聚类分析是直接比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同的类的分析技术 。在市场研究领域
6、,聚类分析主要应用方面是帮助我们寻找目标消费群体,运用这项研究技术,我们可以划分出产品的细分市场,并且可以描述出各细分市场的人群特征,以便于客户可以有针对性的对目标消费群体施加影响,合理地开展工作。 4.判别分析(Discriminatory Analysis)判别分析(DiscriminatoryAnalysis)的任务是根据已掌握的批分类明确的样品,建立较好的判别函数,使产生错判的事例最少,进而对给定的个新样品,判断它来自哪个总体。根据资料的性质,分为定性资料的判别分析和定量资料的判别分析;采用不同的判别准则,又有费歇、贝叶斯、距离等判别方法。费歇(FISHER)判别思想是投影,使多维问题
7、简化为一维问题来处理。选择一个适当的投影轴,使所有的样品点都投影到这个轴上得到一个投影值。对这个投影轴的方向的要求是:使每一类内的投影值所形成的类内离差尽可能小,而不同类间的投影值所形成的类间离差尽可能大。贝叶斯(BAYES)判别思想是根据先验概率求出后验概率,并依据后验概率分布作出统计推断。所谓先验概率,就是用概率来描述人们事先对所研究的对象的认识的程度;所谓后验概率,就是根据具体资料、先验概率、特定的判别规则所计算出来的概率。它是对先验概率修正后的结果。距离判别思想是根据各样品与各母体之间的距离远近作出判别。即根据资料建立关于各母体的距离判别函数式,将各样品数据逐一代入计算,得出各样品与各
8、母体之间的距离值,判样品属于距离值最小的那个母体。 5.对应分析(Correspondence Analysis)对应分析是一种用来研究变量与变量之间联系紧密程度的研究技术。 运用这种研究技术,我们可以获取有关消费者对产品品牌定位方面的图形,从而帮助您及时调整营销策略,以便使产品品牌在消费者中能树立起正确的形象。 这种研究技术还可以用于检验广告或市场推广活动的效果,我们可以通过对比广告播出前或市场推广活动前与广告播出后或市场推广活动后消费者对产品的不同认知图来看出广告或市场推广活动是否成功的向消费者传达了需要传达的信息。 6.典型相关分析典型相关分析是分析两组随机变量间线性密切程度的统计方法,
9、是两变量间线性相关分析的拓广。各组随机变量中既可有定量随机变量,也可有定性随机变量(分析时须F6说明为定性变量)。本法还可以用于分析高维列联表各边际变量的线性关系。 注意:1严格地说,一个典型相关系数描述的只是一对典型变量之间的相关,而不是两个变量组之间的相关。而各对典型变量之间构成的多维典型相关才共同揭示了两个观测变量组之间的相关形式。2典型相关模型的基本假设和数据要求要求两组变量之间为线性关系,即每对典型变量之间为线性关系;每个典型变量与本组所有观测变量的关系也是线性关系。如果不是线性关系,可先线性化:如经济水平和收入水平与其他一些社会发展水之间并不是线性关系,可先取对数。即log经济水平
10、,log收入水平。3典型相关模型的基本假设和数据要求所有观测变量为定量数据。同时也可将定性数据按照一定形式设为虚拟变量后,再放入典型相关模型中进行分析。 7.多维尺度分析(Multi-dimension Analysis)多维尺度分析(Multi-dimension Analysis) 是市场研究的一种有力手段,它可以通过低维空间(通常是二维空间)展示多个研究对象(比如品牌)之间的联系,利用平面距离来反映研究对象之间的相似程度。由于多维尺度分析法通常是基于研究对象之间的相似性(距离)的,只要获得了两个研究对象之间的距离矩阵,我们就可以通过相应统计软件做出他们的相似性知觉图。在实际应用中,距离矩
11、阵的获得主要有两种方法:一种是采用直接的相似性评价,先所有评价对象进行两两组合,然后要求被访者所有的这些组合间进行直接相似性评价,这种方法我们称之为直接评价法;另一种为间接评价法,由研究人员根据事先经验,找出影响人们评价研究对象相似性的主要属性,然后对每个研究对象,让被访者对这些属性进行逐一评价,最后将所有属性作为多维空间的坐标,通过距离变换计算对象之间的距离。 多维尺度分析的主要思路是利用对被访者对研究对象的分组,来反映被访者对研究对象相似性的感知,这种方法具有一定直观合理性。同时该方法实施方便,调查中被访者负担较小,很容易得到理解接受。当然,该方法的不足之处是牺牲了个体距离矩阵,由于每个被
12、访者个体的距离矩阵只包含1与0两种取值,相对较为粗糙,个体距离矩阵的分析显得比较勉强。但这一点是完全可以接受的,因为对大多数研究而言,我们并不需要知道每一个体的空间知觉图。纺织企业统计工作应向商业智能方向发展统计工作在企业管理中越来越显得非常重要,统计工作不仅仅是各类数据的收集,而且是数据仓储、数据管理、数据整合、数据分析、数据预测等等商业职能方面的研究。统计工作从企业的产、供、销、人、财、物,企业和职工、企业和企业、企业和社会、企业和国家、企业和世界等方面,通过对各类数据变动趋势分析、市场变动趋势分析、国内经济政策分析、国际经济形势分析、国际政治因素分析等等诸多方面的研究,给决策者提供完善的
13、决策信息,以促进企业经济运行朝着良性方向发展,从而使企业获得更大的经济效益。纺织企业统计工作应向商业智能化方向发展,才有利于统计工作发展。 下面就纺织企业统计工作应向商业智能化方向发展谈一谈研究范围:原材料数据研究:(1)从原材料到货情况(数量、时间、品种、规格等)入手,分析对生产的保证程度、影响程度,针对两度提出建议措施。(2)从原材料库存情况(分品级进行统计)入手,研制降低过高库存原料水平的模型,加强调度调剂,加速物质周转,提出最大限度降低原材料占用资金的措施建议。(3)从原材料消耗情况(分品种、规格、数量)入手,研究原材料使用是否物尽其用,是否有浪费现象等等,为节约用原材料提出措施建议。
14、产品产量数据研究:研究产品总量变动趋势:(1)产品价值量数据研究,从价值量变动入手,分析价值量发展变化趋势、影响的原因、影响销售额的程度等等。(2)产品实物量数据研究,从产品分大类入手(例如:纱分为棉纱、混纺纱、纯化纤纱,各类产品生产总量的变化趋势各如何?下一步有何应对措施等等。)研究产品实物量变动趋势,从而进一步研究产品生产、销售结构的变动方向、销售发展趋势等等。(3)产品结构数据研究,从大类产品结构入手,研究产品结构变动趋势,观察各类产品分别占总量比重变动趋势,从中发现市场需求发展变动趋势。(4)产品结构变动趋势进行入手,研究原材料需求变动趋势,原料采购变动方向以及原料的构成结构变动趋势等
15、等,指导和预测产品生产、销售和原料采购。产品质量数据研究: (1)从产品质量变动研究影响产品产量的幅度(分大类品种进行分析)。(2)研究由于产品质量波动对产品价值量的波动影响。(3)从产品质量变动研究影响客户满意度、客户忠诚度、贡献度等的影响。(4)从产品质量波动研究影响销售量波动趋势。(5)从产品质量波动预测客户对产品质量需求发展动向。(6)从产品质量波动研究影响企业效益波动趋势。进而研究影响产品质量的诸因素,并提出建议供领导决策参考。 产品销售数据研究: (1)研究产品销售构成比重变动趋势,预测未来产品结构的调整方向及发展方向。(2)从产品价格变动趋势,预测原料价格的变动趋势,给决策层提出
16、建议,在更深层次上制定未来半年内的原料储备量战略、原料结构构成比例等等。(3)从产品销售量(按客户构成编制)变动趋势及占总量比重的变动趋势,分析客户的忠诚度、贡献度等等。 存货数据研究: 重点研究机物料、零部件存货及产品存货。(1)通过对机物料、零部件分类存货数据波动,寻求规律性的东西,确定适度库存量及购货周期,以节约资金占用。(2)通过对产品分类库存数量及分类库存期研究,搞出产品库存适当期限,并为领导提出建议:滞销产品警报、促销产品警报。把产品库存压缩到最低极限,使产品占压资金日趋合理化。 人力资源数据研究:(1)从产品质量定额数据分析入手,调查职工对定额的满意度(高、适中、低),可以用调查
17、问卷的形式进行不定期调查来判断。从而对定额的合理调整提出整改建议。(2)从工资现状数据入手,调查职工对工资额的期望值(根据本单位的实际能力量力而定,分高值、中间值、最低值的具体值),判定职工在劳动及所得方面的满意度及期望值。(3)从职工文化构成比重入手,来研究未来全员教育的发展方向。(4)从全员的专业技术构成入手,研究未来人才需求发展趋势。(5)从全员年龄构成比重入手,研究劳动力的贡献率、未来劳动力的需求发展变化趋势。(6)从研发人员的技术等级构成变动入手,研究未来技术开发的发展趋势,提出人才需求建议。(7)从管理人员分层所占的比重入手,研究各层管理人员分布的合理性、变动趋势,为决策层提出机构
18、调整、人员比重变动的建议。(8)从专业技术人员对口利用情况入手,研究人才的合理利用率变动及未来人才调整趋势,为决策层提出合理化建议。(9)从劳动生产率波动入手,研究劳动生产率波动的原因,预测劳动生产率变动的发展趋势。财务数据研究: (1)偿债能力分析:通过短期偿债能力分析(流动比、速动比)、长期偿债能力分析(资产负债率、所有权长期负债率)对企业的偿债能力发展趋势进行预测,并提出理想的偿债能力建议。(2)资金供需状况分析:首先定一个标准来衡量资金投放多少为适量(一般以能够满足经济正常发展需要为评判的基本尺度),然后再根据资金供应的渠道和所占资金的比重,分析资金供需的合理性。(3)工业资产营运状况
19、研究:通过对总资产利润率、总资产利税率两项指标的变动数据来研究工业资产的运营效率。(4)获利能力分析:通过对成本费用利润率、产值利润率、净资产利润率、销售收入利润率者四项指标的变动趋势,预测未来发展趋势,提出理想获利能力建议。(5)成本、费用分析:对成本构成变动情况进行分析,预测未来成本购成发展趋势。对构成成本因素的价格影响因素进行分析,并预测未来价格走势,给决策层提出建议及应采取的对策。对产品销售费用、管理费用、财务费用分别进行动态分析,并对其波动进行对比说明,揭示波动的主要矛盾和原因,提出建议和改进措施。(6)应收账款和产成品存货(价值量)分析:应收账款科目分银行、分客户进行数据归集,然后
20、计算应收账款平均收款期,和各客户占应收账款的比重,分析各客户影响应收账款的影响程度,提建议,采取相应措施,尽快收回账款,增加流动资金。产成品存货按产品构成从价值量上分析形成的原因,以及变动趋势,提出合理的产成品库建议。(7)坏帐呆帐研究,通过对历年来(关联企业)呆坏帐的分析,预测呆坏帐发生的可能性,为企业预防呆坏帐的发生提出建议,收回资金。 设备和生产能力研究: (1)设备数量研究。通过对专用生产设备数量的变动趋势研究,预测未来生产能力变动趋势,测算未来生产实物量变动趋势。(2)设备维修数据研究:a、从设备完好率研究入手,探索设备完好率变动和设备使用年限的规律性,预测未来设备正常运行的趋势,进
21、而预测未来生产的运行情况。B、从一等一级车率入手,研究设备维修质量的波动影响产品质量的规律,随时提出维修质量的最低极限值数据。c、从设备维修费用入手,研究现有设备维修人工消耗、物料消耗的发展趋势,预测未来几年内消耗值,提出人、物消耗的合理值建议。(3)设备能力研究。对历年来生产能力变动的研究,进一步探究对应的原材料、燃料、电力、劳动力配备、生产量的变动趋势,为企业制定计划和规模扩张提供科学依据。(4)建立生产能力基本指标数据库。A、年初生产能力b、本年新增生产能力c、本年减少生产能力d、年末生产能力。根据综合生产能力的增减变动趋势,提出企业经营战略建议。 市场调查研究: (1)调查原料关联企业
22、的市场变化情况,预测原料资源变化趋势。如原料供应情况变动趋势、原料价格变动趋势、本年度棉花播种面积与去年相比变动幅度、农用物资价格变动情况、本年度自然灾害影响棉花成长情况,预测明年原料供应情况及价格趋势,为产品结构调整及原料合理储备预测前景,提出建议共决策层参考。(2)调查产品用户情况,研究适应用户需要的对策。研究用户的需求发展趋势,引导产品结构的调整。(3)调查国际市场变换,拓宽产品出口渠道。研究出口产品的发展方向及产品结构,开拓国际市场。(4)调查同行业发展情报,研究竞争策略。如新产品的研发、单位用工情况、平均工资水平、能源的单耗、机构的设置、先进技术的引进、国际市场的开拓、企业内部其他产
23、业的发展等等。国内外经济形势研究:(1)国内经济政策研究。如对能源价格或农资价格的限制及放开政策对我们关联企业的影响,从而造成我们原料的价格变动等等进行研究,提出应对措施建议。(2)国际经济形势研究。国际经济形势风云变幻无穷,研究影响我们行业乃至我们企业的影响度。如欧美对我纺织品设限、东南亚纺织企业的扩张等等因素,研究我们如何面对才能摆脱困境。(3)国际政治因素研究。如国家和国家的关系变化影响到行业贸易,战争的发生、自然灾害的发生等因素对行业发展方向及市场需求转变的影响等等。总之,统计工作从事后研究逐步演变为事中分析、事先预测,进而发展成具有商业智能功能的一项重要工作,让企业决策层越来越感到统
24、计工作向商业智能化转变的重要性。数据报表数据分析数据挖掘在数据库中分散、独立存在的大量数据对于业务人员来说,只是一些无法看懂的天书。如何把数据转化为信息,使得业务人员(包括管理者)能够充分掌握、利用这些信息,并且辅助决策,就是商业智能主要解决的问题。经过几年的积累,大部分中大型的企事业单位已经建立了比较完善的CRM、ERP、OA等基础信息化系统。这些系统的统一特点都是:通过业务人员或者用户的操作,最终对数据库进行增加、修改、删除等操作。上述系统可统一称为OLTP(Online Transaction Process,在线事务处理),指的就是系统运行了一段时间以后,必然帮助企事业单位收集大量的历
25、史数据。但是,在数据库中分散、独立存在的大量数据对于业务人员来说,只是一些无法看懂的天书。业务人员所需要的是信息,是他们能够看懂、理解并从中受益的抽象信息。此时,如何把数据转化为信息,使得业务人员(包括管理者)能够充分掌握、利用这些信息,并且辅助决策,就是商业智能主要解决的问题。如何把数据库中存在的数据转变为业务人员需要的信息?大部分的答案是报表系统。简单说,报表系统已经可以称作是BI了,它是BI的低端实现。 现在国外的企业,大部分已经进入了中端BI,叫做数据分析。有一些企业已经开始进入高端BI,叫做数据挖掘。而我国的企业,目前大部分还停留在报表阶段。 数据报表不可取代传统的报表系统技术上已经
26、相当成熟,大家熟悉的Excel、水晶报表、Reporting Service等都已经被广泛使用。但是,随着数据的增多,需求的提高,传统报表系统面临的挑战也越来越多。1.数据太多,信息太少 密密麻麻的表格堆砌了大量数据,到底有多少业务人员仔细看每一个数据?到底这些数据代表了什么信息、什么趋势?级别越高的领导,越需要简明的信息。如果我是董事长,我可能只需要一句话:目前我们的情况是好、中还是差? 2.难以交互分析、了解各种组合定制好的报表过于死板。例如,我们可以在一张表中列出不同地区、不同产品的销量,另一张表中列出不同地区、不同年龄段顾客的销量。但是,这两张表无法回答诸如“华北地区中青年顾客购买数码
27、相机类型产品的情况”等问题。业务问题经常需要多个角度的交互分析。 3. 难以挖掘出潜在的规则 报表系统列出的往往是表面上的数据信息,但是海量数据深处潜在含有哪些规则呢?什么客户对我们价值最大,产品之间相互关联的程度如何?越是深层的规则,对于决策支持的价值越大,但是,也越难挖掘出来。 4. 难以追溯历史,数据形成孤岛 业务系统很多,数据存在于不同地方。太旧的数据(例如一年前的数据)往往被业务系统备份出去,导致宏观分析、长期历史分析难度很大。 因此,随着时代的发展,传统报表系统已经不能满足日益增长的业务需求了,企业期待着新的技术。数据分析和数据挖掘的时代正在来临。值得注意的是,数据分析和数据挖掘系
28、统的目的是带给我们更多的决策支持价值,并不是取代数据报表。报表系统依然有其不可取代的优势,并且将会长期与数据分析、挖掘系统一起并存下去。 数据挖掘看穿你的需求广义上说,任何从数据库中挖掘信息的过程都叫做数据挖掘。从这点看来,数据挖掘就是BI。但从技术术语上说,数据挖掘(Data Mining)特指的是:源数据经过清洗和转换等成为适合于挖掘的数据集。数据挖掘在这种具有固定形式的数据集上完成知识的提炼,最后以合适的知识模式用于进一步分析决策工作。从这种狭义的观点上,我们可以定义:数据挖掘是从特定形式的数据集中提炼知识的过程。数据挖掘往往针对特定的数据、特定的问题,选择一种或者多种挖掘算法,找到数据
29、下面隐藏的规律,这些规律往往被用来预测、支持决策。 关联销售案例: 美国的超市有这样的系统:当你采购了一车商品结账时,售货员小姐扫描完了你的产品后,计算机上会显示出一些信息,然后售货员会友好地问你:我们有一种一次性纸杯正在促销,位于F6货架上,您要购买吗? 这句话决不是一般的促销。因为计算机系统早就算好了,如果你的购物车中有餐巾纸、大瓶可乐和沙拉,则86%的可能性你要买一次性纸杯。结果是,你说,啊,谢谢你,我刚才一直没找到纸杯。 这不是什么神奇的科学算命,而是利用数据挖掘中的关联规则算法实现的系统。 每天,新的销售数据会进入挖掘模型,与过去N天的历史数据一起,被挖掘模型处理,得到当前最有价值的
30、关联规则。同样的算法,分析网上书店的销售业绩,计算机可以发现产品之间的关联以及关联的强弱。 数据报表、数据分析、数据挖掘是BI的三个层面。我们相信未来几年的趋势是:越来越多的企业在数据报表的基础上,会进入数据分析与数据挖掘的领域。商业智能所带来的决策支持功能,会给我们带来越来越明显的效益。基于Logistic模型的市场细分 市场细分在战略营销中占据着极其重要的地位。营销大师Kotler等(1999)把市场细分定义为“将市场划分为有着显著需求、特征或行为差异的不同群体的消费者,每一群体的消费者对产品或营销组合有着同质的需求”。Dibb等(2001)认为,市场细分就是将具有异质特征的消费者进行聚类
31、的过程,细分后的每一类消费者具有相似的需求或购买特征。企业则根据自身的资源和外部竞争情况从中选择自己具有比较优势或认为更具有投资价值的细分市场作为企业的目标市场。企业的一切营销战略,都必须从市场细分出发。没有市场细分,企业在经营时就如同“瞎子摸象、大海捞针”,根本无法锁定自己的目标市场,也就无法在市场竞争中找到自己的定位。如果没有明确的市场定位,企业也就无法规划和塑造差异化的品牌形象并赋予品牌独特的核心价值,当然就更无法针对性地去设计独特的产品去满足市场了。只有进行市场细分,才有营销战略的差异化。因此,市场细分是企业战略营销的重要组成部分和平台。市场细分的依据(或细分变量)通常是消费者的人文统
32、计特征,如年龄、性别、地域、教育文化水平、可支配收入、职业、消费观念、个人偏好等。市场细分的目的是找准目标市场,以便企业有针对性地实施市场推广策略。既然如此,为什么不根据市场本身的特点(如市场禀赋、产品在市场中的扩散速度、市场规模等)进行市场细分呢?基于这种考虑,本文选取市场禀赋和人际传播速度进行市场细分。其中市场禀赋是指一个市场在其初始状态时接受新产品的能力,它与市场的成熟程度以及经济发展水平相关。在我国,东部沿海地区的市场禀赋要比中西部地区较高,对新产品的接受能力较强。人际传播(word of mouth)对于产品的推广非常重要。与媒体广告等其他营销推广形式相比,人际传播具有无可比拟的丰富
33、性与灵活性。在新媒体到传统媒体的转型时期,人际传播在品牌营销、引导性销售方面仍然处于首要地位,被认为是最有效的营销推广形式之一。因此选取市场禀赋和人际传播速度作为市场细分依据有重要意义。可能因为这两个指标较难进行量化处理,所以至今学术界和理论界还没有这方面的研究。本文首先以手机产品为例,根据Logistic模型分别对全国31个省市估计市场禀赋和人际传播速度两个参数,然后以此为细分依据对各省市进行区域性市场细分,并分析各个细分市场的特点,以期对企业的营销推广工作有所帮助。二、研究方法(一)产品选择研究我国市场的特点,首先必须选择一个有代表性的产品。本文选取人们比较熟悉的手机产品作为分析对象。移动
34、通信技术是近年来发展最为迅速的技术之一。2002年底,全球手机用户数量首次超过了固定电话用户数量,达11.5亿。到2005年底,全球手机用户数量已突破20亿。2006年底我国手机生产量约为4亿部,占全球产销总量的40,成为手机生产销售第一大国。随着手机用户数量的逐年增长和手机功能的丰富,手机已经渗透到社会生活的各个层面,给社会政治、经济、文化、教育及个人生活等各个方面带来了深远的影响。手机具有复杂的产品属性。针对不同的消费者,它既可能是功能简单、价值几百元的低档消费品,也可能是集相机、MP3、GPS、电脑等功能为一体的价值上万元的高档消费品;既可能是富人的生活必需品,也可能是穷人的奢侈品;既可
35、能是使用数十年的耐用消费品,也可能是经常更换的易耗品。可以说,手机是现代社会最具代表性的商品,以手机产品的扩散来研究市场是比较适合的。(二)模型的选择研究新产品扩散最常用的模型是著名的Bass模型,但该模型只适用于那些没有重复购买的耐用消费品,而不适合分析手机这一复杂产品,据统计,消费者平均每隔一两年就会换一部新的手机。本文采用的是Logistic模型。该模型由美国生物学家和人口统计学家珀尔(R.Pearl)和利德(J.reed)(1920)首先在生物繁殖研究中发现,后被广泛应用于生物生长过程和产业成长过程的描述。实证表明,很多成功推广的新产品和新技术,如传真机,CD,彩色电视机,电子邮件和互
36、联网,其扩散的过程和路径是相似的。它表现为一种“S”型增长特征,即先缓慢启动,然后高速增长,最后减速增长并趋于饱和。本文认为,用Logistic生长曲线函数来分析手机产品特征,有较高的相似性和可行性。Logistic模型假定,产品在市场中的扩散速度与其市场占有量和潜在市场容量的乘积成正比。其函数原型为:(1)其中,t为时间, Y为因变量,这里指手机产品的市场规模,L为Y的最大极限值,表示产品的饱和(或最大)市场容量。M、 r分别为可控参数。 从(1)式解得(2)在(2)式中令t=0,可知(3)由(3)式可知参数M主要与初始市场销量Y(0)和饱和市场容量L有关,而后两者又取决于该市场的成熟程度以
37、及消费者的购买能力与产品本身的特性等,所以参数M即代表“市场禀赋”。由(2)式可知,一个地区的市场禀赋越高,新产品在该市场上的销量就越大。从(1)式可以看出,参数r反映了已购买手机的消费者(数量为Y)和没有购买手机的消费者(L-Y)的交互作用对手机市场扩张速度 的影响,所以称之为人际传播(或口碑)影响参数。由(2)式可知, r越大,新产品在该市场上的销量Y越大。(三)数据收集与选择本文没有采用手机在市场上的实际销售量,而是采用普及率指标,它是指拥有手机的人数占地区总人口的比例。其原因有二:一是销售量数据受地区总人数的影响,普及率指标则消除了这一影响。二是普及率可以消除一人几部手机的影响。中国市
38、场成长很快,为反映手机市场的现状,本文所用数据时间段为2002年到2006年,相关数据全部来自信息产业部的官方网站和历年中国统计年鉴。三、研究结果(一)Logistic模型参数估计由于(2)式中要估计的参数有三个L、M和r,所以不能用OLS方法,本文采用统计分析软件SPSS for Windows 13.0 中的非线性最小二乘方法,分别对全国及各省市进行估计,结果如表1所示。从拟合度R2来看,所有地区的拟合值都在0.96以上,说明采用(2)式的拟合效果很好;从T统计值来分析,各省市地区的模型参数的T统计量都达到显著水平,表明参数L、M和r 的估计是有效的。如果以市场禀赋M为横轴(为清晰显示,M
39、采用对数形式)、人际传播速度为纵轴,并以全国的M和r 值作为平均水平分界线,则全国31个省市被分成、四个市场区域,如图1所示,其中圆圈的大小反映了各省市手机市场规模的大小。由于饱和市场容量L在统计上不太稳定,误差较大,所以本文根据2006年各省市的手机实际普及率来刻画圆圈的大小。需要注意的是,实际普及率接近饱和市场容量L的地区(如北京、上海等)并不意味着市场没有增长空间,因为这些地区消费者的购买类型主要是手机的更换而不是新购。(二)结果分析从图1中圆圈的大小分布来看,越往右圆圈越大,这说明市场禀赋越高的地区,其市场规模越大。从水平方向上看,虚线右半部分的省市多为东部经济发达地区,左半部分的省市
40、多为中西部经济不发达地区。这说明,一个地区的经济发展水平与市场禀赋正相关,经济越是发达,人们的收入水平越高,就越可能购买新产品。从垂直方向上看,虚线上半部分的省市比下半部分更容易受人际传播的影响。进一步分析可知,四个区域具有明显不同的特征:区:人际传播较快,市场禀赋较低。包括的地区主要是西部省份,特别是我国的几个少数民族自治区省份,如宁夏、西藏、广西、新疆、内蒙古,全部包含在该区,所以称之为“西部少数民族区”。这一区域经济不发达,消费者购买力较弱,对新产品的需求不旺盛,因此市场禀赋较低。在人际传播方面,文化背景和价值观会影响人际传播双方信息的选择、整合和传播方式,进而影响信息的传播效果,从而导
41、致人际传播的差异。不同文化背景下的受者搜寻信息的主动性和所选择的搜寻途径会有所不同。Bruce(2000)在研究中发现,处于同一文化背景下传者和受者之间发生口碑传播的可能性要大于处于不同文化背景下的双方之间的传播,且前者的传播影响强于后者。另一方面,根据交易费用理论,人们总是尽可能地减少不确定性所带来的风险和成本,于是无论是传者还是受者都注重与同文化背景、彼此熟知的人建立互动的人际传播。因此,相通的文化与人际传播的影响呈现一种正相关关系。同理,由于价值观决定了人们对事物的判断和评价,具有相同价值观的传播双方容易达成共识,而彼此价值观相左的人很难有一种互通有无的传播关系,即便有,最终也会在双方的
42、纷争中瓦解。总之,具有相同文化背景和价值观的人们能产生较强的人际影响力。同一自治区的少数民族具有相同的价值观,属于同一文化,因此更利于人际传播,所该区域人际传播对产品扩散的影响较大。区:人际传播较慢,市场禀赋较低。该区域主要包括的主要是我国中部省份,经济也不发达,不妨称之为“中部不发达地区”。该地区是中华民族的主要发源地,承载着中华五千年的文明史。历代的改朝换代,兵荒马乱,民不聊生,生活朝不保夕。长期的历史和文化的影响,形成了人民的贫困和相互不信任的局面。由此人际传播效果不佳,市场禀赋较低也就不难理解了。区:该区域的特征与区正好相反,人际传播较快,市场禀赋较高。包括的主要是我国经济最发达的省市
43、,如北京、上海、广东、浙江、江苏等,所称之为“东部发达地区”。这一区域是我国改革开放国策的最早受益者,市场经济较为发达,人们的购买力较强,所以市场禀赋较高。同时,该区域市场经过20多年的发展,作为市场经济基石的彼此信任,也在一定程度上建立起来了。另一方面,受沿海海洋文化的影响,人们在思想上也更加开放,更具包容性,人际传播时更容易产生信任感。所以该区域人际传播较快。区:人际传播较慢,市场禀赋较高。主要包括和天津、福建和东北三省。相对于前面“东部发达地区”来说,区域虽然也同样地处东部,但在经济方面稍逊一筹,而强于中西部地区,所以称为“东部次发达地区”。相应地在市场禀赋方面的表现也是低于“东部发达地
44、区”而高于“中部不发达地区”。也许因为这一地区的人太能“忽悠”了,过分的能言善辩反而使人们产生戒备心理,人际传播的效率也就打折扣了。这一特点可能东北三省表现最为突出。四、结论和讨论(一)研究结论本文根据市场禀赋和人际传播速度两个市场特征变量,把全国31个省市分成具有明显不同特征的四个细分区域:“西部少数民族区”、“中部不发达地区”、“东部发达地区”和“东部次发达地区”。其中“西部少数民族区”和“东部发达地区”虽然同为人际传播较快的区域,但原因是不一样的:前者多出于文化的原因,后者多是经济因素的影响。(二)研究意义对于企业营销工作者来说,上述市场细分是有重要意义的:从产品角度来看,市场禀赋高的地
45、区适合销售价值较高的高档产品,反之则销售低档产品;从产品促销方式的选择方面来分析,人际传播速度快的地区适合采用人员推销和营业推广的方式进行产品促销,反之则要更多地依靠大众媒体传播方式进行促销。对于手机市场,国外手机巨头非常重视市场调研,并根据市场调研的结果进行消费者细分,准确选择目标市场,精确进行市场定位,它们往往采取高端市场树品牌,中端攫取利润,低端打市场的高中低端通吃的蚕食政策,使国产手机只能在狭小的市场缝隙中勉强生存。国产手机制造商对消费者细分不明确,产品定位模糊,市场失利是很自然的事。因此本文的研究对国产手机厂商采用市场策略具有参考作用。(三)研究不足传统的市场细分为了更加详细地描述目标消费群体的特征,往往采用多个(一般是25个)细分变量,把整个市场细分成几十个甚至成百上千个细分市场,然后再对每个细分市场进行评估,从中选择适合本企业的目标市场,这是一项十分艰难的工作。本文仅根据市场禀赋和人际传播速度两个细分变量进行市场细分,这只是一种粗略的细分,提供的市场信息也是有限的。另一方面,如果能多选择几个代表性的产品进行相同的分析,然后对细分后的市场进行归纳分析,得出的结论也许更有说服力.