《数据挖掘在通信公司CRM中的应用实例(共10页).doc》由会员分享,可在线阅读,更多相关《数据挖掘在通信公司CRM中的应用实例(共10页).doc(10页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上 数据挖掘在通信公司CRM中的应用实例随着中国电信的改革重组,中国通信业取得了跨越式的发展,成为国民经济中发展速度最快的行业之一,中国通信业总规模现已在世界排名第一。与此同时,中国通信市场竞争也日趋激烈。通信运营商的经营观念逐渐从技术质量第一向服务客户第一转化。以前的营销模式已经无法满足客户的多样化、层次化、个性化的需求。长期以来,通信单位大量详尽的业务数据也只是被简单地应用在各种业务系统中,没有被更有效地开发利用。如何利用这些数据进一步拓宽通信业务,促进通信业务发展,从而为通信业提供决策支持服务,已经成为各个通信单位的当务之急。近几年迅速崛起的数据挖掘技术成为实现这
2、些目标的有效手段。它可以深入分析客户信息、客户价值和行为,从而使营销具有洞察力、精确化,并通过从数据中挖掘价值来减少营销成本、提高营销效益。3.3.1 客户细分模型和挖掘算法选择构建客户分类模型需要用到第2章所介绍的一些技术。其中聚类技术就是其中之一。在前面的章节中我们曾了解到聚类和分类有着很大的区别:分类时,我们事先选择一些属性作为分类标准,通信企业总是会将重要的、有影响力的属性作为分类的依据;而在实际应用当中,通信企业事先根本不知道哪些属性会起到作用。而找到那些起关键作用的属性是聚类技术的任务之一。在通信客户分析中,聚类分析能够帮助我们发现特征迥异的不同客户群和对客户分类起关键作用的指标变
3、量,并辅助运营商对各客户类别的特征进行深刻观察。通信客户从营销属性方面分为三类:普通客户、价值客户和黄金客户,其中普通客户消费行为有较大的随机性,分布较广,规律难寻,比较适于聚类分析。本数据挖掘实例采用通话行为、数据业务使用情况等作为客户分类变量,把通信行为相似的人群聚为一组。数据挖掘方法论选用CRISP-DM(Cross-Industry Process for Data Mining)过程模型。即交叉行业数据挖掘过程标准。它从数据挖掘技术应用的角度来划分挖掘任务,将数据挖掘技术和实际应用紧密结合。CRISP-DM过程模型的主要步骤有商业理解、数据理解、数据准备、建立模型、数据挖掘、评价和实
4、施以及结果发布,如图3-9所示。该过程的各个环节按顺序进行,但需要不断地循环往复进行数据探索和模型的调优。这里为了简化说明问题,先不考虑循环往复的探索和调优过程,直接顺序考察各个环节。(点击查看大图)图3-9CRISP-DM各环节所涉及的内容和人员客户的消费行为和需求通过调查问卷以及访谈的方式来实现。3.3.2 数据挖掘模型和挖掘步骤在各种硬件条件和软件条件都具备的情况下,就可以开始进行挖掘的工作了。1数据准备数据准备过程如下:(1)确定项目目标,制定挖掘计划。(2)分析变量的获取。(3)数据收集和获取。(4)数据集成。依据CRISP-DM流程,第一要确定项目目标,之后制定挖掘计划。首先必须明
5、确项目的商业目标,这个目标应该是适于用选取的聚类分析方法来达到的。所定义的客户细分的商业目标是对某地方数十万普通客户,从客户行为的角度进行客户分类,以了解不同客户群的消费行为特征,为发展新业务、原有客户挽留、对其他通信公司用户争夺的针对性策略的制订提供依据,并实现企业稳定现有客户量、提高客户增长量的战略目标。之后就应该对分析变量进行全面获取,在保证数据的一致性、完整性、有效性和层次性的基础上,数据指标具有较高的完备性,应该覆盖全部经营分析与数据挖掘的需求。我们选择的数据来源主要有客户档案记录、客户营销记录、销售单主表、销售退货主表、销售付款表、客户联系记录、客户投诉记录和客户关怀记录等。变量准
6、备的结构如图3-10所示。(点击查看大图)图3-10变量准备的结构客户的通信行为以及需求特征类别见表3-1。表3-1 客户行为特征信息表客户的通信行为客户的需求特征类别 短消息使用次数移动梦网使用次数WAP上网时间GPRS数据流量方便性及信息实时性的需求IP长途使用次数优惠时段通话次数套餐定制和使用次数拨打10086次数对资费的敏感程度本地、长途、漫游呼叫时长本地、长途、漫游呼叫次数呼叫时间、次数(繁忙/非繁忙时段、工作/休息时段、优惠/非优惠时段)呼叫类型(主叫、被叫、呼叫转移)对通话的多层次需求服务种类对个性化服务的需求程度数据是数据挖掘的根基,在确定了分析目标和执行方案后,需要对各个数据
7、源的数据进行清洗、整理并集成,以确定这次分析需要哪些方面的数据,然后将它们汇总起来,形成这次分析任务的数据库(数据仓库)。在此实例中,数据来源于移动公司自己的CRM系统、客户计费系统,客户服务系统、营销系统以及业务结算系统等。基于客户需求和上述行为特征信息表,定义了几组细分变量,d_代表时常,t_代表频率,见表3-2。在这里只列出通话形式和通话比例表。表3-2 细分变量表(简表)通话形式市话d_localt_local省内长途d_toll_InProvincet_toll_InProvince跨省长途d_toll_BetweenProvincet_toll_BetweenProvince国际长
8、途d_toll_htmt_toll_htm通话比例网内通话d_mob_Ttlt_ mob_Ttl联通通话d_uni_Ttlt_uni_Ttl小灵通通话d_phs_Ttlt_phs_Ttl固定电话通话d_fix_Ttlt_fix_Ttl2数据准备数据准备包括所有从原始的未加工的数据构造最终分析数据集的活动,是数据挖掘过程中最耗时的环节,甚至要占据整个数据挖掘项目一半以上的工作量。数据准备工作的流程如图3-11所示。(点击查看大图)图3-11 数据准备工作的流程数据准备的过程和数据挖掘的过程请参考第1章相关内容,这里不再赘述。3建立模型在生成最终的数据集后,就可以在此基础上建立模型来进行聚类分析了
9、。建立模型阶段主要是选择和应用各种建模技术,同时对它们的参数进行校准以达到最优值。在明确建模技术和算法后需要确定模型参数和输入变量。模型参数包括类的个数和最大迭代步数等。在建模过程中,我们采用多种技术手段,并将建模效果进行对比。需要挑选合适的变量参与建模。参与建模的变量太多会削弱主要业务属性的影响,并给理解分群结果带来困难;变量太少则不能全面覆盖需要考察的各方面属性,可能会遗漏一些重要的属性关系。输入变量的选择对建立满意的模型至关重要。应结合此次分析任务的目标,选择有重要业务意义并与数据挖掘目标密切相关的变量;被选择的变量应具备较好的数据质量,并且被选变量之间相关性不宜太强。不同的技术方案产生
10、的模型结果有很大不同,而且模型结果的可理解性也存在较大差异。另外,对结果的分析和描述也很关键,不恰当的描述会造成误导。需要指出的是,不同的商业问题和不同的数据分布属性会影响模型建立与调整的策略,而且在建模过程中还会使用多种近似算法来简化模型的优化过程。因此还需要业务专家参与调整策略的制定,以避免不适当的优化造成业务信息丢失。建立模型是一个螺旋上升,不断优化的过程,在每一次聚类结束后,需要判断聚类结果在业务上是否有意义,其各群特征是否明显。如果结果不理想,则需要调整聚类模型,对模型进行优化,称之为聚类优化。聚类优化可通过调整聚类个数及调整聚类变量输入来实现,也可以通过多次运行,选择满意的结果。通
11、常可以依据以下原则判断聚类结果是否理想:类间特征差异是否明显;群内特征是否相似;聚类结果是否易于管理及是否具有业务指导意义。4模型评估通过上面的处理,就会得到一系列的分析结果和模式,它们是对目标问题多侧面的描述,这时需要对它们进行验证和评价,以得到合理的,完备的决策信息。对产生的模型结果需要进行对比验证、准确度验证、支持度验证等检验以确定模型的价值。在这个阶段需要引入更多层面和背景的用户进行测试和验证,通过对几种模型的综合比较,产生最后的优化模型。模型评估阶段需要对数据挖掘过程进行一次全面的回顾,从而决定是否存在重要的因素或任务由于某些原因而被忽视,此阶段关键目的是决定是否还存在一些重要的商业
12、问题仍未得到充分的考虑。验证模型是处理过程中的关键步骤,可以确定是否成功地进行了前面的步骤。模型的验证需要利用未参与建模的数据进行,这样才能得到比较准确的结果。可以采用的方法有直接使用原来建立模型的样本数据进行检验,或另找一批数据对其进行检验,也可以在实际运行中取出新的数据进行检验。检验的方法是对已知客户状态的数据利用模型进行挖掘,并将挖掘结果与实际情况进行比较。在此步骤中若发现模型不够优化,还需要回到前面的步骤进行调整。3.3.3 结果分析和市场策略制定(1)根据对客户分类的结果,对客户重新定位,深入对客户的认识,并以此为基础制定应对策略。对客户的认识主要包括以下几个方面:我们的客户分为哪几
13、种类型?每一类客户有什么不同的构成特征与消费行为特征?客户群有什么流动趋势?一个产品或业务应该向哪一个群体的客户推销?如何激励一个特定客户群的消费行为,使客户价值最大化?不同类型的客户在某个特定时刻的需求是什么?同一个客户在不同时刻的消费需求是什么?在这些问题的基础上,进行结果分析和推广方案及销售渠道的制定。1结果分析客户分类模型最终产生一些客户分类,根据这些群的特征可分成10个组,各组的频繁与不频繁通信行为比较见表3-3。表3-3 各组的频繁与不频繁通信行为比较分组号频繁通信行为不频繁通信行为组1:手机低使用率组与小灵通通话拨打10086次数本地、省内长途漫游、省际长途、IP、与联通用户通话
14、组2:固话通话频繁组与固定电话通话本地、省内长途漫游、省际长途、IP、与联通用户通话组3:手机低使用率组与固定电话通话省际长途、IP电话与联通通话次数组4:联通频繁联系组与联通用户通话时长、次数跨省漫游与联通用户通话时长、次数组5:移动频繁联系组与移动用户通话时长、次数与联通和固话通话时长,次数组6:短信高使用率组短信、梦网短信、WAP、拨打10086港澳台、国际长途漫游组7:大量本地通话组本地通话时长、次数、呼叫转移;与移动用户通话时长、次数组8:高IP&省内漫游组IP通话时长、次数、省内漫游组9:高省际长途漫游组省际长途漫游通话时长、次数WAP使用,10086拨打次数组10:高国际长途漫游
15、组港澳台、国际长途漫游针对每个组的频繁与不频繁的通信消费行为,对每个客户群进行分析,并制定相应的客户营销策略,限于篇幅,这里只给出组1:手机低使用率组和组6:短信高使用率组的详细分析结果,见表3-4和表3-5。表3-4 手机低使用率组客户群分析组1:手机低使用率组客户群分析本组用户的基本特点是:(1)对手机的使用,一般只使用通话功能,并且通话需求低,平均每天仅2.1次(2)优惠时段通话次数在所有组中最高,占了整个通话次数的7(3)短信使用量较低(4)IP通话次数占整个通话次数的比例最高,有28,可看出这类人群对资费非常敏感(5)主要在本地通话,并且主要与市内用户沟通(6)每个市内、长途电话的时
16、长在10组人群中居前几位,但次数却最少。可看出此类人群一般是有事情才打电话,所以谈话时间长、次数少(7)主叫电话次数是被叫电话次数的1.6倍,主叫时长是被叫时长的1.79倍(8)访问营业厅次数少,拨打10086次数多,可见此客户群对资费比较敏感通过对这类型客户通话行为的分析,可得到这一组客户的整体行为特点:此类人群对资费非常敏感,可能会对经济节约话费类产品感兴趣。此类人群被叫行为不频繁,可通过单向收费类产品来增加其被叫需求。由于交流范围相对狭窄,并且主要为市内通话,容易成为小灵通或大灵通的抢夺对象,因此可以设计一些市话优惠类的产品来保住客户,防止客户流失。针对以上这些行为特点,我们可以制定出相
17、应的推广计划和销售渠道:由于此类人群中可能包括有低工资人群、家庭妇女、老人、学生、社交需求少的技术人员,所以可选择超市、商场、学校等地进行海报宣传或安排人员发送传单在人群聚集地进行一定的促销活动,实物奖励会对该组人群有很大的吸引力。除基本代销点外,可选择此客户群体的居民楼附近超市、小商店等作为代销点,效果会比较好。表3-5短信高使用率组客户群分析组6:短信高使用率组业务使用行为这类人群最明显的特征是:(1)点对点短信、网内短信、彩信、WAP等数据业务使用量大,可能是因为此类人群对新技术好奇心比较强,并且接受新技术能力比较快,对各类型活动参与积极性高(2)通话次数居中,平均每天5次左右,每个通话
18、时间在10组中最高,特别是优惠时段通话次数、时长最高。IP使用占整个通话的30,并且每个IP电话通话时长最长。整体分析,此类人群可能有较强的长聊习惯,对资费相对敏感(3)拨打10086次数最高,特别是资费查询,平均每月拨打11.52次,可见该人群对资费比较敏感(4)短信联系人群最高,平均有27.78人。与联系最密切的交往圈短信发送量也最高,平均每天3.2条。其原因可能是因为短信要比通话费用便宜,或者可能是该组人群喜欢并习惯短信交流3.3.3 结果分析和市场策略制定(2)通过对短信高使用率组的通信行为分析,可以得知该组用户有如下特点:该组用户对资费比较敏感,且有沟通和通话时长的需求,可设计随意聊
19、等进一步推进客户长聊行为的产品。此类客户应对新推出的增值业务,特别是基于短信应用的增值业务产品很感兴趣。由于此群体平均年龄在24岁,是用户组中最年轻的人群,并且女性用户比例最高,因此可以考虑一些适用年轻人群或女性用户的信息类产品。针对这样的消费特点,我们可以制定推广计划:因为该群体中可能包括大部分学生,所以可选择学校、电影院、商场作为宣传渠道,可进行海报,发送传单,活动促销等宣传、短信宣传、网络宣传、时尚杂志广告等。销售渠道:学校附近的代销点、电子城、手机市场代销点。需注意的是,该群体入网时间最短,需从培养其忠实程度的角度设计产品和服务。 2资费设计因为客户的种类不同,所以消费行为有很大差异。
20、在对客户进行聚类分析之后,就可以按照分析结果来制定相应的资费。资费的合适与否直接关系着通信运营商的客户数量和影响着客户忠诚度。以组1为例,手机低使用率组的 用户,根据他们的消费行为特征,判断出他们最基本的通话行为只是市内通话,并且主叫行为比被叫行为频繁,对话费的适用程度十分关注,因此如果通信运营商无法对其提供出性价比较高的资费服务,那么,这一些客户就有可能会被市话费更为便宜的小灵通或大灵通运营商抢夺去,并带来一系列的负面影响,造成无法估量的损失。由此可见,资费的设计在通信运营商的客户关系管理中占有很重要的地位。通信资费设计一般流程为:驱动资费分析、明确资费设计元素、设计资费计划以及资费计划的实
21、施,如图3-12所示。在遵循资费设计合理、公司利润保证的情况下,就可以将新设计的资费情况推向市场,接受检验。当然,由于竞争对手、市场、内部用户等多种因素的影响,可以考虑实行隐藏式资费计划,不做公开宣传,通过短信、10086等渠道实行特定试点人群的隐藏式销售。此案例尽管所选用的实例数据集的规模不是很大,但实现起来仍很烦琐。要有效实现各种数据挖掘应用,就需要好的数据挖掘平台。通过使用数据挖掘平台提供的各种有效的数据挖掘工具,它们能挖掘多种类型的数据,可以便捷地实现数据挖掘应用。数据挖掘领域有着广泛的应用需求,面向商业客户关系管理的数据挖掘平台的开发改进应是今后数据库技术发展的重要方向。(点击查看大图)图3-12 资费设计流程专心-专注-专业