《批发分销商销售状况及策略研究分析5355.docx》由会员分享,可在线阅读,更多相关《批发分销商销售状况及策略研究分析5355.docx(101页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、批发分销销商销售售状况及及策略研研究摘要本文针对对批发分分销商销销售状况况及策略略的研究究,使用描述述统计、方方差分析析、判别别分析等等方法,分分别构建建描述统统计对比比分析模模型、双因素素方差分分析模型型、两总体体距离判判别模型型、多总总体距离离判别模模型,并并利用EExceel、MMatllab等等软件编程程处理数数据,得得出了该批发发分销商商销售状状况、影影响因素素以及有有利的经经营策略略。针对问题题一要求求,给出该该数据资资料的基基本分布布状况、变变量之间间的相关关程度或或关联程程度,以以及批发发商目前前经营状状况的评评价。本文首先先通过EExceel对数数据资料料做基本本的描述述统计
2、以以及相关关关系分分析,可可得出数数据资料料的基本本分布状状况以及及变量之之间的相相关程度度,再通通过最描描述统计计结果的的对比分析析得出该该分销商商目前经经营状况况的评价价。针对问题题二要求求,需分析不不同销售售途径、不不同销售售区域以以及两者者之间的的交互作作用是否否会显著著影响六六大类商商品的销销售额,并最终找到影响六大类商品销售的主要因素。首先在Excel中对数据进行处理,再分别对销售途径和销售区域做无交互作用的双因素因素分析和交互作用的双因素分析,然后通过Matlab编程算出方差分析结果,分析后得出影响六大类商品销售的主要因素。针对问题题三要求求,需建建立销售售区域和和销售途途径的判
3、判别模型型,并分析影响响销售区区域和销销售途径径的主要要商品类类别。其其中销售售途径可可采用两两总体距距离判别别方法得得出销售售途径的的判别模模型,并并通过MMatllab计计算判别别系数得得出影响响销售途途径的商商品类别别;而销销售区域域可采用用多总体体的距离离判别法法建立销销售区域域的判别别模型,并并通过逐逐个剔除除商品类类别因素素的方法法计算误误判率,用过Matlab计算得出判别系数和误判率,得出影响销售区域的主要商品类别,并综合分析得出批发销售商提供智慧的经营销售策略。本文最后后还对模模型进行行了误差差分析、评评价和推推广,并并针对问问题二中中的方差差分析所所需的条条件进行行齐性检检验
4、,通通过非参参数检验验对模型型进行改改进,使结果更更准确。关键词:批发商商销售策策略;描述统统计;方方差分析析;判别分分析;Mattlabb1 问题的的重述一、背景景知识1总背背景介绍绍批发分销销商是指指向制造造商或经经销单位位购进商商品,供供给其他他单位(如零售售商)进进行转卖卖或供给给制造商商进行加加工制造造产品的的中间商商。批发发商的客客户一般般是销售售公司或或者大型型零售商商,不同同的客户户对批发发商的需需求不同同,导致致了批发发商在不不同客户户不同销销售区域域和途径径的条件件下会有有不同的的进货组组合。2问题题的产生生随着市场场的竞争争的愈加加激烈,批批发分销销商商需需要更有有效率的
5、的经营销销售策略略,但是是经营策策略需要要对日常常收集的的数据进进行大量量分析和和总结,但但数据量量多繁杂杂,无法法直观地地了解到到想要的的信息。3已有有的对策策数据挖掘掘是一种种决策支支持过程程,它主主要基于于人工智智能、机机器学习习、模式式识别、统统计学、数数据库、可可视化技技术等,高高度自动动化地分分析企业业的数据据,做出出归纳性性的推理理,从中中挖掘出出潜在的的模式,帮帮助决策策者调整整市场策策略,减减少风险险,做出出正确的的决策。统计分析析是指运运用统计计方法及及与分析析对象有有关的知知识,从从定量与与定性的的结合上上进行的的研究活活动。它它是在一一定的选选题下,集集分析方方案的设设
6、计、资资料的搜搜集和整整理而展展开的研研究活动动。系统统、完善善的资料料是统计计分析的的必要条条件。将数据挖挖掘或多多元统计计的技术术应用于于商业领领域,利利用企业业所积累累的资料料,透过过相关变变量的分分析,找找出顾客客区隔、消消费行为为、业务务成本与与效率等等对企业业极为重重要的资资讯,为为企业管管理提供供决策支支持,从从而提高高企业经经营的竞竞争力和和商业智智慧。二、相关关资料1Whholeesalle ccusttomeers datta(BB题附件件)。三、要解解决的问问题1问题题一对该该数据资资料作描描述统计计,给出出该数据据资料的的基本分分布状况况、变量量之间的的相关程程度或关关
7、联程度度,最终终给出该该批发分分销商的的目前经经营状况况的评价价。2问题题二分析析不同销销售途径径、不同同销售区区域以及及两者之之间的交交互作用用是否会会显著的的影响六六大类商商品的销销售额,最最终找到到影响六六大类商商品销售售的主要要因素。3问题题三利用用数据分分析方法法通过分分别建立立销售区区域和销销售途径径的判别别模型,分分别找出出影响销销售区域域的主要要商品类类别,影影响销售售途径的的主要商商品类别别,最终终为批发发销售商商提供智智慧的经经营销售售策略。2 问题题的分析析一、问题题的总分分析本文题为为批发分分销商销销售状况况的研究究,即通通过对该该分销商商历史销销售数据据的分析析和研究
8、究,得出出该分销销商的经经营状况况、影响响因素以以及有利利于经营营销售的的策略。该该问题属属于数理理统计的的内容,可可采用描描述统计计、方差差分析、判判别分析析的方法法进行研研究,整整体框图图如图11表示:图1 整整体框图图二、对具具体问题题的分析析1对问问题一的的分析问题一要要求对该该数据资资料作描描述统计计,给出出该数据据资料的的基本分分布状况况、变量量之间的的相关程程度或关关联程度度,最终终给出该该批发分分销商的的目前经经营状况况的评价价。根据据要求主主要通过过描述统统计的方方法对数数据进行行分析。首首先通过过Exccel对对数据资资料做基基本的描描述统计计以及相相关关系系分析,可可得出
9、数数据资料料的基本本分布状状况以及及变量之之间的相相关程度度,再通通过最描描述统计计结果的的分析得得出该分分销商目目前经营营状况的的评价。2对问问题二的的分析问题要求求分析不不同销售售途径、不不同销售售区域以以及两者者之间的的交互作作用是否否会显著著的影响响六大类类商品的的销售额额,最终终找到影影响六大大类商品品销售的的主要因因素。可可通过无无交互作作用的双双因素因因素分析析和交互互作用的的双因素素分析,找找到影响响六大类类商品销销售的主主要因素素。3对问问题三的的分析问题三要要求利用用数据分分析方法法通过分分别建立立销售区区域和销销售途径径的判别别模型,分分别找出出影响销销售途径径和销售售区
10、域的的主要商商品类别别,最终终为批发发销售商商提供智智慧的经经营销售售策略。其中销售途径可可采用两总体距离判别方法得出销售途径的判别模型,并通过所得线性判别函数中定影响销售途径的商品类别;而销售区域可采用多总体的距离判别法建立销售区域的判别模型,并通过逐个剔除商品类别因素的方法计算误判率,得出影响销售区域的主要商品类别。并通过对上述判别模型和影响因素的研究,综合分析得出批发销售商提供智慧的经营销售策略。3 模模型的假假设1假设设六大类类商品商商品销售售额相互互独立; 2假设设模型中,三三总体协协方差矩矩阵差异异可以忽忽略,并并且不会会造成显显著误差差4 名名词解释释与符号号说明一、名词词解释1
11、描述述统计:是通过过图表或或数学方方法,对对数据资资料进行行整理、分分析,并并对数据据的分布布状态、数数字特征征和随机机变量之之间关系系进行估估计和描描述的方方法。12数据据分析方方法:数数据分析析是指用用适当的的统计方方法对收收集来的的大量第第一手资资料和第第二手资资料进行行分析,以以求最大大化地开开发数据据资料的的功能,发发挥数据据的作用用。是为为了提取取有用信信息和形形成结论论而对数数据加以以详细研研究和概概括总结结的过程程。数据据也称观观测值,是是实验、测测量、观观察、调调查等的的结果,常常以数量量的形式式给出。2二、主要要符号说说明序号符号符号说明明1平均值2方差3标准差4相关系数数
12、5偏度6峰度7水平对指指标的效效应8水平对指指标的效效应9水平与对对指标的的交互效效应10n维向量量x与总体体G的马氏氏距离11总体的协协方差矩矩阵12回带误判判率5 模模型的建建立与求求解一、问题题一的分分析与求求解1对问问题的分分析问题要求求对该数数据资料料作描述述统计,给给出该数数据资料料的基本本分布状状况、变变量之间间的相关关程度或或关联程程度,最最终给出出该批发发分销商商的目前前经营状状况的评评价。我我们利用用Exceel自带带的数据据分析功功能对数数据进行行进行处处理,并并对结果果进行对对比分析析,得出出经营状状况的评评价。2对问问题的求求解模型 描述统统计对比比分析模模型 模型型
13、的准备备描述统计计是将收收集到的的数据用用一些概概括性的的统计量量以及图图形、图图表加以以描述,它它将数据据本身包包含的信信息加以以总结、概概括、浓浓缩、简简化,使使问题变变得更加加清晰、简简单、易易于理解解。通过试试验和观观察得到到数据。这些数数据是带带有随机机性的数数据.为统计计分析目目的,数数据被分分为定性性(有序序的和名名义的)数数据和定定量(计计量和计计数的)数数据。本本文中将将保鲜品品、乳制品品、杂货产产品、冷冻开开支、洗涤剂剂和纸制制品、熟食产产品、销售途途径以及及销售区区域作为为8组数数据进行行描述统统计和相相关性分分析。 模型型的建立立平均 它是数据据集中趋趋势的度度量,反反
14、映了数数据的平平均水平平。其优优点是能能反映每每个数据据的作用用,缺点点是易受受数据中中极端值值的影响响。方差 样本均值值是总体体均值的的无偏估估计。标准差差 标准差是是方差的的平方根根,方差差与标准准差越大大,意味味着数据据的分散散程度越越大;相相反,方方差与标标准差越越小,意意味着数数据的分分散程度度越小,也也即向平平均值的的集中程程度越高高。方差差与标准准差度量量了数据据的离散散程度。中位数数 中位数以以其排列列位置来来描述集集中趋势势,比中中位数大大(小)的数据据各占整整个数据据的一半半。其优优点是不不受个别别极端值值的影响响,具有有稳健性性,缺点点是缺乏乏敏感性性。众数众数是指指在数
15、据据中出现现次数最最多的数数据值,是是衡量定定性数据据集中位位置的重重要量度度。偏度偏度和峰峰度是刻刻画数据据分布形形态的两两个统计计量,它它们与数数据的矩矩有关。数数据的矩矩分为原原点矩和和中心矩矩。k阶原原点矩k阶中心心矩偏度的计计算公式式为偏度是描描述样本本数据对对称性的的统计量量。关于于均值对对称的数数据,其其偏度为为0,数数据的右右侧较左左侧更为为扩展,偏偏度为正正,反之之,数据据的左侧侧较右侧侧更为扩扩展,偏偏度为负负。峰度的的计算公公式为峰度是以以正态分分布为标标准,来来描述数数据向分分布尾端端散布的的趋势。近近似于正正态的分分布,其其峰度接接近于00。尖峰峰式分布布(峰度度为负
16、),标准准正态分分布(峰峰度为00),扁扁平式分分布(峰峰度为正正)。标准误误差标准误差差一般用用来判定定该组测测量数据据的可靠靠性,在在数学上上它的值值等于测测量值误误差的平平方和的的平均值值的平方方根。标标准误差差在正态态分布中中表现出出正态分分布曲线线的陡峭峭程度,标标准误差差越大,曲曲线越平平坦,反反之,曲曲线越陡陡峭。相关系系数相关系数数是用以以反映变变量之间间相关关关系密切切程度的的统计指指标。相相关系数数是按积积差方法法计算,同同样以两两变量与与各自平平均值的的离差为为基础,通通过两个个离差相相乘来反反映两变变量之间间相关程程度;着着重研究究线性的的单相关关系数。 模型型的求解解
17、调用Exxcell描述统统计功能能,对数数据进行行描述统统计结果果如表11和表22表1 描描述统计计结果表表描述统计计量ChannnellRegiionFresshMilkkGrocceryyFrozzenDeteergeentssPapeerDeliicasssenn平均1.322272272.5443一八八一八一一八120000.3357966.266679511.277730711.933228811.4993一五244.877标准误差差0.02223一一三0.033691119991602.93777351.84557453.04555231.43775227.29885一三4.443
18、33中位数13850443627747555.5一五266816.5965.5众数133366611966206224259一八834标准差0.466805520.777427724449126447.33373800.377795033.166348544.677347677.855428200.1006方差0.211907720.5999499782261.6EE+0885446699667903110100423566785532273324336795229977峰度-1.4427446-0.11001110883511.553644124.66694420.991466754.668
19、922819.0009446170.69449偏度0.76609551-1.228366269932.566一三2234.055375553.588742295.900798863.633一八55111.一一五一五五9区域121121148734443927777608444408224479440最小值1135532533最大值23112一一五1734998927880608669408227479443求和5821119952800一三11255003577349885622一三51165001267785776709943观测数440440440440440440440440最大(11)
20、23112一一五1734998927880608669408227479443最小(11)1135532533置信度(95.0%)0.044385550.0772544617761一八55.0003691.51一一三890.40777454.86331446.72886264.23224表2 相相关系数数统计表表相关系数数ChannnellRegiionFresshMilkkGrocceryyFrozzenDeteergeentssPapeerDeliicasssennChannnell1.000Regiion0.0661.000Fressh-0.1170.0661.000Milkk0.466
21、0.0330.1001.000Grocceryy0.6110.011-0.0010.7331.000Frozzen-0.220-0.0020.3550.122-0.0041.000Deteergeentss_Paaperr0.6440.000-0.1100.6660.922-0.一一三1.000Deliicasssenn0.0660.0550.2440.4110.2110.3990.0771.000由表1可可知主要的销销售途径径是1,主主要的销销售区域域(中位位数和众众数)是是3。保保鲜品(FFRESSH)平平均开支支为1220000,是几几种产品品中均开开支最高高的,说说明该供供货商的的主要
22、输输出开支支为保鲜鲜品;杂杂货产品品(GROOCERRY)平平均开支支79551.2277,是是销量第第二的产产品种类类。每个个种类的的产品标标准差都都很高,说说明离散散程度很很高,可可以看出出不同地地区不同同渠道对对各类产产品的需需求较强强的随机机性;峰峰度都为为正,说说明跟正正态分布布类似,比比正态分分布扁平平。偏度度较低,大大体类似似中高两两边低的的平衡状状态分布布。其中中熟食产产品(DDELIICATTESSSEN)的峰度度和偏度度都超高高,这类类产品与与正态分分布近似似度低,尾尾部散布布的趋势势较明显显,分布布较为平平均。由表2可可知销售途径径(CHHANNNEL)与乳制品(MILK
23、)、杂货产品(GROCERY)、洗涤剂和纸制品(DETERGENTS&PAPER)相关性较强,说明不同的销售途径会影响上述三种产品的批发量,而保鲜品(FRESH)、冷冻开支(FROZEN)与销售途径基本无关;销售区域(REGION)与各个品种的相关性都很弱;保鲜品(FRESH)与冷冻开支(FROZEN)相关性较强,冷冻成本提高时批发商有可能减少保鲜品的批发量以减少保鲜成本;乳制品(MILK)与杂货产品(GROCERY)、洗涤剂和纸制品(DETERGENTS&PAPER)、熟食产品(DELICATESSEN)有较强的正相关性说明这些产品具有相似特点;杂货产品(GROCERY)与洗涤剂和纸制品(D
24、ETERGENTS&PAPER)相关性特别高,因为这两类为生活必需品。总之,该该批发商商经营状状况为:主要销销售途径径是1,主主要销售售区域为为3,主主要销售售产品类类型为保保鲜品和和杂货产产品,各各种产品品的需求求具有随随机性和和离散性性,销售售途径对对乳制品品和生活活用品的的影响较较大,而而保鲜品品与冷冻冻等保鲜鲜支出的的成本有有关。该该批发商商可能是是某超市市或者商商场的经经销商,产产品的种种类较多多,量也也比较大大,分布布也较平平均。二、问题题二的分分析与求求解1对问问题的分分析问题要求求分析不不同销售售途径、不不同销售售区域以以及两者者之间的的交互作作用是否否会显著著的影响响六大类类
25、商品的的销售额额,最终终找到影影响六大大类商品品销售的的主要因因素。设设销售途途径为因因素A,销售区区域为因因素B,因素素A有两个个水平,因因素B有三个个水平,在在Exceel中对对数据进进行处理理后,分分别做无无交互作作用的双双因素因因素分析析和交互互作用的的双因素素分析,然然后通过过Matllab编编程计算算,得出因因素A,因素素B,A和B交互作作用检验验的p值,将将其与给给定的显显著性水水平进行行比较,。再分分析比较较三个检检验的pp值的大大小找到到影响六六大类商商品销售售的主要要因素。2对问问题的求求解模型 双因因素方差差分析模模型 模型型的准备备双因素方方差3分析需需考虑两两个因素素
26、对所关关心的指指标的影影响,两两个因素素分别为为A,BB,他们分分别取rr,s,个不同同的水平平,记为为和将在水水平组合合下的试试验结果果看成随随机变量量,考虑虑因素AA,B,对指标标的影响响是否显显著,仍仍然假定定在水平平组合下下的指标标服从正正态分布布,并假假设各个个水平组组合下的的指标方方差相同同。双因素方方差分析析有两种种类型:一个是是无交互互作用的双双因素方方差分析析,它假假定因素素A和因素素B的效应应之间是是相互独立立的,不不存在相相互关系系,无交互互作用的的双因素素方差分分析其结结果与对对每个因因素分别别进行单单因素方方差分析析的结果果相同;另一个个是有交交互作用用的双因因素方差
27、差分析,它它假定因因素A和因素素B的结合合会产生生出一种种新的效效应。 模型型的建立立设取个水水平,取个水平平,在水平平组合服服从正态态分布,。又设设水平组组合下做做了个试试验,所得结结果记作作,且相互互独立。将分解为为其中是总均值值,是水平平对指标标的效应应,是水平平对指标标的效应应,是水平平与对指标标的交互互效应。所以可建建立如下下模型原假设为为无交互互影响的的双因素素方差分分析因为无交交互影响响,所以以=0,于于是记其中为总总平方和和,为因素素A的平方方和,为为因素BB的平方方和,反反应了试试验的随随机误差差,而且且满足当成立时时,当成立时时,检验规则则为交互作作用的双双因素方方差分析析
28、记其中为总总平方和和,为因素素A的平方方和,为为因素BB的平方方和,为为误差平平方和,为交互作用的平方和,而且满足当成立时时,根据此统统计量,可可以检验验 模型型的求解解将销售途途径看做做因素AA,将销销售区域域看做因因素B,则因因素A有两个个水平,因素B有三个水平,,然后分析这两个因素及其交互作用是否会显著的影响六大类商品的销售额,在Excel中对数据进行处理后通过Matlab(见附录程序1)编程做方差分析可得保鲜品的结果如图2,图2 保保鲜品两两因素及及其交互互作用的的方差分分析结果果通过整理理可得到到六大类类商品销销售额方方差分析析的结果果如表33表3 六六大类商商品两因因素及其其交互作
29、作用的方方差分析析结果销售途径径销售区域域交互作用用FProbbFFProbbFFProbbF保鲜品9.50.000221.6440.199610.50.6009乳制品59.99801.0550.35520.0880.92275杂货产品品147.4100.7330.488340.5990.55527冷冻开支支12.0050.000060.9880.377441.8550.一五五82洗涤剂和和纸制品品191.401.2880.277791.5440.21146熟食产品品0.8990.34460.6220.533670.一三三0.87767通过比观观察表33,可以以得到影影响保鲜鲜品销售售额的主主
30、要因素素是销售售途径;影响乳制制品销售售额的主主要因素素是销售售途径;影响杂货货产品销销售额的的主要因因素是销销售途径径;影响响冷冻开开支销售售额的主主要因素素是销售售途径;影响洗涤涤剂和纸纸制品销销售额的的主要因因素是销销售途径径;销售售途径,销销售区域域,以及及里面或或者之间间的交互互作用都都不是是是影响熟食食产品销销售额的的主要因因素。三、问题题三的分析析与求解解1对问问题的分分析问题要求求利用数数据分析析方法通通过分别别建立销销售区域域和销售售途径的的判别模模型,分分别找出出影响销销售途径径和销售售区域的的主要商商品类别别,最终为为批发销销售商提提供智慧慧的经营营销售策策略。其其中销售
31、售途径可可分为途途径1和和2,可可采用两两总体距距离判别别方法得得出销售售途径的的判别模模型,并并通过所所得线性性判别函函数中的的判别系系数,来来确定影影响销售售途径的的商品类类别;而而销售区区域可分分为区域域1、区区域2以以及区域域3,可可采用多多总体的的距离判判别法建建立销售售区域的的判别模模型,并并通过逐逐个剔除除商品类类别因素素的方法法计算误误判率,得得出影响响销售区区域的主主要商品品类别。并并通过对对上述判判别模型型和影响响因素的的研究,综综合分析析得出批批发销售售商提供供智慧的的经营销销售策略略。2对问问题的求求解模型 销售途途径判别别模型两总总体距离离判别法法 模型型的准备备定义
32、 马氏距距离:马马氏距离离是由印印度统计计学家马马哈拉诺诺比斯(PC Mahhalaanobbis)提出的的,由于于马氏距距离具有有统计意意义,在在距离判判别分析析时经常常应用马马氏距离离。一个向量量到一个个总体的的马氏距距离: 设是取取自均值值向量为为,协方差差矩阵为为的总体体G的一个个行向量量,则称称为n维向量量x与总体体G的马氏氏距离。计算总体体的协方方差矩阵阵:由于实实际问题题中只能能得到两两个样本本的协方方差矩阵阵、,因此此当两个个总体协协方差矩矩阵相等等时如何何确定总总体的协协方差矩矩阵的方方法如下下:;其中,分别为为两个样样本的容容量。回代误判判率:设、为两个个总体和和是分别别来
33、自,的训练练样本,以以全体训训练样本本作为个个新样品品,逐个个代入已已建立的的判别准准则中判判别其归归属,这这个过程程称为回回判。若若属于的的样品被被误判为为属于的的个数为为个,属属于的样样品被误误判为属属于的个个数为个个,则误误判率估估计为: 模型型的建立立先考虑两两个总体体的情况况,设有有两个协协差阵相相同的维维正态总总体和,对给给定的样样本Y,判别别一个样样本Y到底是是来自哪哪一个总总体,一一个最直直观的想想法是计计算Y到两个个总体的的距离。我我们用马马氏距离离来指定定判别规规则,有有:;令;当,y不不考虑分分类;因此有;当和S已已知时, 是一个已知的p维向量,W(y)是y的线性函数,称
34、为线性判别函数。a称为判别系数。用线性判别函数进行判别分析非常直观,使用起来最方便,在实际中的应用也最广泛。由于实际际问题中中只能得得到两个个样本的的协方差差矩阵,因此当当两个总总体协方方差矩阵阵相等时时如何确确定总体体的协方方差矩阵阵的方法法如下:;其中分分别为两两个样本本的容量量。故判别模模型的建建立过程程如下:分别计计算各组组的离差差矩阵;计算总总体的协协方差矩矩阵计算类类的均值值;计算判判别函数数的系数数;判别函数数的常数数项生成判判别函数数,进行行回代误误判;代入待待测样本本,判类类。模型的的求解本题中每每个样本本可看做做一个66维向量量,;分别表示示FREESH:保鲜品品;MILL
35、K: 乳制品品; GRROCEERY: 杂货货产品;FROOZENN: 冷冷冻开支支;DETTERGGENTTS_PPAPEER: 洗涤剂剂和纸制制品;DELLICAATESSSENN: 熟熟食产品品;根据附表表中的数数据,在在Exccel中中对按照照销售途途径1,22进行数数据的分分类,利利用MAATLAAB软件件编程(见见附录程程序2)求得判别函数的系数常数项为为;即最后的的线性判判别函数数模型为为:回代检验验得出误误判率,模模型判别别准确度度较高可可以接受受。结果分析析:观察察判别函函数的系系数可知知,对应应系数的的绝对值值分别为为0.110500,0.30779相比比其他系系数较大大,
36、说明明对应的的杂货产产品(GROOCERRY)、洗洗涤剂和和纸制品品(DEETERRGENNTS&PAPPER)对对销售途途径影响响较为明明显,尤尤其是洗洗涤剂和和纸制品品对销售售途径的的判别起起到决定定性作用用。模型 销售区区域判别别模型多总总体距离离判别法法 模型型的建立立多总体的的距离判判别法:设有个个元总体体,分别别有均值值向量和和协方差差阵,对对任给的的m元样品品Y,判断断它来自自哪个总总体, 计算YY到k个总体体的马氏氏距离,比比较后,把把X判归给给距离最最小的那那个总体体,若则检验的总总体协方方差矩阵阵相等,则则: 上上式中的的第一项项与i无关,舍舍去,得得一个等等价的函函数:将
37、上式整整理得:令则距离判判别法的的判别函函数为判别规则则为:则 模型型的求解解根据本题题中附表表中的数数据在EExceel中销销售区域域分为11,2,3三类类。利用MAATLAAB软件件编程(见见附录程程序3)求得三类样本的判别函数系数分别为:常数项分分别为00.78823,11.03381,00.9一一五6。故故判断规则则:,则;ii=1,2,33。回代误判判率p=0.17550,判判别模型型准确度度较高,可可以接受受。由于多样样本判别别模型无无法直接接得出线线性判别别函数,为为了找出出影响销销售区域域的主要要因素,考考虑利用用误判率率比较的的方式侧侧面分析析六大影影响因素素对销售售区域的的
38、影响。主主要步骤骤如下:依次剔剔除因素素求出新新的5维维向量误误判率,比比较的大大小变化化:剔除因素素FREESH:;回代计计算误判判率;剔除因素素MILLK:;回代计计算误判判率;以此类推推共得66种误判判率;比较与与的大小小:;表示剔剔除因素素后,误误判率降降低,判判别模型型更加精精确,同同样表示示剔除的的因素ii对整体体的分类类不但没没有推进进作用,反反而加大大了判别别的模糊糊性,理理应剔除除;表示剔剔除因素素后,误误判率增增大,判判别模型型精确度度降低,表表示剔除除因素ii之后整整体分类类不再明明显,即即提出的的因素ii是影响响分类的的主要因因素;表示剔剔除因素素后误判判率不变变,即该
39、该因素对对分类几几乎没有有影响。针对附表表中的数数据,利利用MAATLAAB软件件编程求求解结果果如下:(见附附录程序序4)回回代误判判率比较较表4表4 回回代误判判比较表表0.177050.177050.177050.177050.177050.177050.17705结果分析析:由表表格数据据,逐个个去除因因素后回回代误判判率不变变,表明明区域销销售几乎乎不受任任何销售售产品因因素的影影响,这这也与问问题一通通过相关关系数法法分析得得出的结结论相呼呼应。综合上述述对销售售途径和和销售区区域分类类影响因因素的分分析,我我们建议议该经销销商注意意加大冷冷冻产品品与洗涤涤剂纸制制品销售售途径的的
40、研究与与开拓,因因为这两两个因素素与销售售途径的的相关性性最大;而销售售区域与与这六类类因素无无明显关关系,可可能是因因为销售售区域的的消费水水平或者者销售对对象较为为相似,因因此在确确定营销销策略的的时候,不不用过多多考虑销销售区域域的划分分。6 误误差分析析1问题题二在无无交互作作用的双双因素方方差分析析中,我我们考虑虑的理想想化,比比如在研研究销售售途径时时,不仅仅控制销销售区域域这一因因素,还还需要控控制其他他题目中中没有考考虑的因因素是没没有影响响的。显显然其他他因素是是不可避避免的,所所以会对对结果造造成误差差。2问题题三判别别模型对对于落在在附近的的样本点点,按照照此判别别法虽可
41、可进行判判断,但但误判的的可能性性较大。7 模模型的评评价与推推广一、模型型的优点点 1问题题一中用用Exccel进进行描述述统计方方便快捷捷;2问题题二模型通通过Matllab 编程可可以直接接算出各各因素和和交互作作用是否否对六大大类商品品销售额额是否显显著影响响,不用用进行重重复复杂杂的计算算;对于于双因素素方差分分析模型型,有些些指标不不满足方方差的齐齐效性,我我们在模模型的改改进中采采用了非非参数检检验去分分析各因因素的显显著性;3问题题三基于于马氏距距离法建建立判别别模型使使判别相相比一般般的欧氏氏距离更更加准确确,因为为马氏距距离不受受量纲的的影响,且且考虑到到了数据据之间的的关
42、系,排排除变量量之间的的相关性性干扰。二、模型型的缺点点1问题题二中方方差分析析模型有有很多假假定条件件,我们们采用方方差分析析时有些些条件忽忽略了。在在最后模模型改进进的时候候,我们们运用非非参数检检验进行行了销售售途径和和销售区区域显著著性分析析,但由由于非参参数检验验的局限限性,没没能进行行交互作作用的显显著性分分析。2问题题三判别别模型使使用马氏氏距离夸夸大了变变化微小小的变量量的作用用。三、模型型的推广广1描述述统计对对比分析析模型可用用Exccel简简便的描描述统计计工具进进行推广广,应用用于所有有需要基基础统计计量的领领域;2双因因素方差差分析模模型对于问问题二的的双因素素方差分
43、分析模型型研究两两个因素素及其交交互作用用对六大大类商品品销售额额的显著著影响,我们可以考虑其他的因素,进行多因素方差分析,为销售商提供更加有效的经营决策,本模型能推广到社会经济生活的很多方面;3判别别分析模模型该判别别模型对对于数据据判别的的精度较较高,故故可以广广泛应用用于销售售分析中中未知数数据的或或者丢失失数据寻寻找以及及归类,根根据判别别函数可可以清晰晰得出相相关因素素权重大大小,故故该模型型还可用用于销售售分析中中重要商商品类型型的挖掘掘,为商商家经营营策略的的制定提提供简便便高效的的依据。8 模模型的改改进在问题二二中,问题要要求分析析不同销销售途径径、不同同销售区区域以及及两者
44、之之间的交交互作用用是否会会显著的的影响六六大类商商品的销销售额,最最终找到到影响六六大类商商品销售售的主要要因素。所所以我们们建立了了无交互互作用的的双因素素方差分分析和有有交互作作用的双双因素方方差分析析,从而而找出了了影响六六大类商商品销售售的主要要因素,然然而做方方差分析析需要满满足一定定的假设设条件:1各处处理条件件下的样样本是随随机的;2各处处理条件件下的样样本是相相互独立立的;3各处处理条件件下的样样本分别别来自正正态总体体;4各处处理条件件下的样样本方差差相同,即具有有齐效性性。所以现在在对数据据运用SSPSSS软件进进行正态态性检验验和方差差齐性检检验。运用SSPSSS软件对
45、对六大类类商品销销售额进进行Koolmoogorrov-Smiirnoov检验验,可得得到结果果如图33图3 假假设检验验汇总从图2可可以看出出六大类类商品的的销售额额都不服服从正态态分布在SPPSS软软件中对对销售途途径和销销售区域域分组下下的数据据分别进进行方差差齐性检检验得到到结果如如表5,表6。表5 销销售区域域的方差差齐性检检验Leveene 统计量量df1df2显著性保鲜品10.773114380.0001乳制品39.007214380.0000杂货产品品98.004214380.0000冷冻开支支26.990914380.0000洗涤剂和和纸制品品149.067714380.0000熟食产品品.036614380.8449表6 销售区区