某运营商数据挖掘项目汇报(ppt 37页)6chlu.ppt

上传人:muj****520 文档编号:91065928 上传时间:2023-05-21 格式:PPT 页数:38 大小:1.34MB
返回 下载 相关 举报
某运营商数据挖掘项目汇报(ppt 37页)6chlu.ppt_第1页
第1页 / 共38页
某运营商数据挖掘项目汇报(ppt 37页)6chlu.ppt_第2页
第2页 / 共38页
点击查看更多>>
资源描述

《某运营商数据挖掘项目汇报(ppt 37页)6chlu.ppt》由会员分享,可在线阅读,更多相关《某运营商数据挖掘项目汇报(ppt 37页)6chlu.ppt(38页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、某运营商数据挖掘项目汇报_新增用户维系2010年3月-2-新增用户维系基本流程1、采用生存分析法,对有流失倾向的用户进行提前预警,并可根据用户流失概率的高低划定预警级别 流失高危用户群 在网异动用户群 正常用户群异动预警监控1、维系策略方案生成 渠道养卡监管措施 重入网与反复用户管控措施 正常低网龄用户维系措施2、维系方案实施 营销案实施流程 维系渠道 维系方式维系策略及方案1、维系情况反馈2、目标达成情况3、维系效果评估:渠道养卡识别及监管 重入网与反复重入网 正常低网龄用户维系维系效果评估1、新增用户分群:渠道养卡 重入网与反复重入网用户 正常低网龄用户细分根据正常低网龄用户偏好进行细分新

2、增用户分群 建立新增用户维系闭环管理体系,准确分群,分级预警,制定针对性的维系策略和方案并实施,实现新增用户保有。-3-渠道养卡识别与监控 重入网与反复重入网管理 正常低网龄用户维系新增用户维系-4-柳州渠道养卡行为特征及监控思路建议p 产品:渠道养卡一般选择无月租或最低月租的产品,以降低养卡的成本,研究发现柳州2种类型产品均被渠道选择使用p ARPU:渠道养卡号码消费额一般较低,研究发现柳州养卡号码月均消费一般低于15元p 主叫时长:渠道养卡号码主叫时长非常低,研究发现柳州有70%以上无通话行为,有通话行为用户主叫时长主要集中在3分钟以内p 用户状态:研究发现柳州渠道养卡新增号码停机流失高峰

3、出现在入网后的第1-3个月p 消费情况:同一个渠道发展的养卡号码中,出现多个号码消费行为一致的情况,如多个号码入网当月和次月消费完全一致p 激活IMEI:养卡号码在激活时,一般用同一个手机激活,因此养卡号码中大量号码的激活IMEI一致柳州渠道养卡行为特征p 制定疑似养卡渠道的判断规则:从渠道发展用户的产品、ARPU、用户状态进行判断,当用户数占比符合一定标准后,即判断为疑似养卡渠道;p 制定疑似养卡号码的判断规则:从用户消费情况、激活IMEI等进行判断,符合一定标准的号码为疑似养卡号码;p 分析疑似养卡渠道的养卡号码量,计算养卡号码占其当月新发展的比,并按各渠道此比例排序养卡行为监控思路建议

4、通过研究发现柳州渠道养卡行为特征及监控思路建议如下:-5-以上判断标准,都以同一渠道发展的用户作为判断基础数据;判断步骤是首先判断疑似养卡渠道,在判断其为疑似养卡渠道后,统计其疑似养卡号码数量 对养卡号码的判断模型是对渠道养卡违规行为进行分析的基础,需要在执行中进一步分析、调研完善优化判断规则,提升判断准确率。疑似养卡渠道和养卡号码判断规则疑似养卡渠道p产品:渠道新增用户中,30%以上的用户都为两广情零听计划或都市“零听”计划二,该渠道为疑似养卡渠道p主叫时长:渠道新增用户中,50%以上或100人以上的用户入网当月和次月主叫时长在3分钟内,该渠道为疑似养卡渠道p用户状态:渠道新增用户中,入网后

5、在第3个月,30%以上的用户状态为停机流失,该渠道为疑似养卡渠道疑似养卡号码p消费情况:a.出现5个或以上号码号码入网当月和次月主叫时长都在3分钟内;b.或出现5个或以上号码号码入网当月和次月消费在5元以内;c.或出现2个以上号码入网当月或次月应收费完全一致,这些号码为疑似养卡号码p激活情况:a.出现5个或以上号码号码激活IMEI一致;b.或2个或以上号码登记身份证号一致这些号码为疑似养卡号码pARPU:渠道新增用户中,30%以上或100人以上的用户入网当月和次月ARPU低于5元,该渠道为疑似养卡渠道-6-渠道养卡识别与监控 重入网与反复重入网管理 正常低网龄用户维系新增用户维系-7-重入网与

6、反复重入网(跳蚤)用户识别规则N N+1 N-6 N-4 N-5 N-2 N-3 N-1新入网激活月新入网激活后第1月新入网激活月前半年的存量用户历史IMEI库或身份证库N月在网用户,区分新增和存量用户判断重入网用户判断新入网用户的有效IMEI或身份证号码N月新入网用户中的重入网和反复重入网用户名单剔除无效IMEI或身份证号码生成、维护历史有效IMEI库或身份证号库 重入网:新用户IMEI或身份证号与历史IMEI或身份证号码能够匹配(6个月以内)。如,9月新入网用户IMEI或身份证号与3月到8月用户IMEI或身份证号码库匹配后,得到9月新入网用户中重入网用户。反复重入网(跳蚤用户):重入网用户

7、在6个月以内重入网2次及2次以上的用户。识别规则:通过对新入网用户使用手机的IMEI号(或身份证号码)与存量用户的IMEI号历史库(或身份证号码历史库)进行分析识别出重入网和反复重入网用户。为了提高分析结果的准确率,每月定期对上月新入网的用户(上月入网并激活的用户)进行分析。分析示意如下:用户在N月入网并激活(有话单产生),则在N+1月(计算月)对N月入网并激活的所有用户进行重入网分析。-8-用户重入网主要原因分析产品 产品 价格 价格 促销 促销/宣传 宣传 渠道 渠道 产品线过长,产品重叠较多,目标用户群存在较多交叉,不同品牌及资费存在内部竞争 产品价格调整比较频繁,而且在价格调整过程中没

8、有考虑产品体系间的平衡问题 预存费用低,用户入网门槛不高,使其可以轻易弃卡 新入网促销活动优惠力度过大 品牌及资费资费套餐互转门槛过高,停机保号、套餐互转等宣传不足 部分社会渠道迫于指标压力或利益驱动,诱导用户换卡 社会渠道虚假激活,通过养卡恶意套取酬金 追求经济收益,受入网优惠的吸引 换取吉祥号码 欠费 竞争对手以低资费、大力度的优惠活动吸引用户,但整体质量未能让用户满意,从而使用户在短暂离(移动)网后重新入网公司内部竞争对手用户服务 服务 补卡成本高,手续复杂,补卡不如买新卡 欠费提醒不及时,欠费后被停机,选择重入网-9-从产品、促销、渠道、传播、服务等多方面入手加强重入网与反复重入网管理

9、,降低重入网比率重入网与反复重入网管理措施 加强入网促销活动管理,减少促销活动对在网用户的干扰;提高入网首次预存费用,增加在网时长;用户忠诚度管理:网龄营销。产品/促销 传播 渠道 服务 加强(社会)渠道掌控,规范渠道行为,减少系统性离网行为。采用户外广告、报纸等大众媒体及营业厅、10086短信、网站、WAP等自有媒体体开展网龄营销、优惠补卡及带号转品牌、套餐、停机保号等的传播。加强欠费管理,减少无效欠费;主卡付费+亲情网;账户低余额时充值提示;优惠或免费补卡;推荐带号转品牌或带号转套餐。-10-渠道养卡识别与监控 重入网与反复重入网管理 正常低网龄用户维系新增用户维系-11-正常低网龄用户维

10、系基本策略剔除了渠道养卡用户和反复重入网用户后所获得的正常低网龄用户是新增用户流失控制的重点。运用数据挖掘方法,识别出不同流失预警级别的用户,针对高危用户和异动用户分别采取针对性的营销捆绑手段进行维系,同时结合网龄营销,延长用户生命周期。正常低网龄用户分群用户 重绑:针对高危用户在网黏性已很弱的特点,采取较大力度的营销捆绑策略,以返还周期短的财务捆绑和力度较大的业务捆绑为主,以服务捆绑为辅。力保:针对异动用户尚处于流失犹豫期、还具有一定黏性的特点,维系策略将以强化用户的业务黏性为重点,以业务捆绑和较长返还周期的财务捆绑为主,以服务捆绑为辅。全用户常规保有(不研究)。细分用户群 细分用户群 基本

11、策略 基本策略流失高危 流失高危用户 用户在网异动 在网异动用户 用户相对稳定 相对稳定用户 用户-12-多级预警,多级维系 在模型挖掘的基础上,准确判别正常低网龄用户的流失倾向,根据用户流失概率的高低分别实施针对性的维系策略和措施,对可能流失的用户提前预防,多级维系,有效地防止用户流失。流失异动用户营销捆绑日常维系及异动监控办理未办理模型匹配低网龄用户流失高危用户是否流失流失未流失11 2一级匹配和维系;二级匹配和维系。1 2-13-正常低网龄用户细分、预警及维系框架精准营销模型新增用户细分模型用户价值 在网时长 渠道偏好 促销偏好 用户号码 消费特征用户清单话费余额新增网用户流失模型商务高

12、端用户群长途话务突出群本地话务突出群本地低端用户群数据业务发烧群漫游突出用户群数据业务兴趣群本地话务偏好群在网异动用户 流失高危用户长途话务突出群本地话务突出群本地低端用户群漫游突出用户群数据业务突出群本地话务偏好群当月新增用户其他新增用户营销案-14-用户流失预警和细分建模过程n 流失现状分析n 流失原因分析n 流失用户特征分析n 流失预警建模目标沟通确定n 流失细分模型目标沟通确定n 根据建模要求和现有数据情况,构思、沟通和确定建模数据提取需求 n 提取09年1-10月新增用户在1-10月的自然属性和消费行为数据n 提取09年10月新增用户在10月的日消费行为数据n 数据质量审核n 数据探

13、索n 非正常用户的剔除。根据渠道养卡和跳蚤用户识别模型提取异常用户n 数据抽样。确定建模用户集合n 建模衍生变量计算。根据提取的基础数据宽表计算衍生变量n 建模变量筛选 特征建模分析 卡方分析 方差分析 双变量分析 Pearson相关分析 wald显著性检验 量重要性分析 n 建模变量数据转换 对数变换 标准化变换n 确定建模用户集n 确定建模用户数据集n 采用Two Step聚类算法,建立用户细分模型 月数据用户细分模型(高价值 用户和在网2月及2月以上的新增用户细分 日数据用户细分模型(在网1月新增用户细分)n 业务解释聚类结果,调整模型参数和建模变量,直到得到满意结果n 确定建模用户集n

14、 确定建模用户数据集n 采用逻辑回归和决策树算法建立流失预警模型 在网2月新增用户流失预警模型 在网2月以上新增用户流失预警模型 在网1月新增用户流失预警模型n采用生存分析算法建立高价值用户流失预警模型n 模型的评估 提升图、收益图 混淆矩阵。准确率和查全率n 模型的优化 建模训练集比例 异常值处理 建模变量 建模方法 模型参数 显著性检验方法 显著性检验变量剔除阈值 树的深度和页节点记录个数-15-数据提取 数据清洗 数据审核 数据集成 数据挖掘宽表构建 缺失数据处理 极值数据处理 错误数据处理 冗余数据处理 数据统计错误审核 数据源错误审核 数据统计口径审核数据准备确保建模数据的完整性、可

15、用性和完整性 提取建模所需数据数据准备-16-筛选建模变量、根据模型要求进行数据变换建模准备经分数据挖掘宽表变量转换变量筛选健康度建模指标库变量清洗-17-用户细分采用凝聚层次聚类算法选择初始化 初始化更新结束计算包含每对样本间距离(如欧氏距离)的相似矩阵,把每个样本作为一个簇使用相似矩阵查找最相似的两个簇将两个簇合并为一个簇,簇的个数通过合并被更新;同时更新相似矩阵,将两个簇的两行(两列)距离用1行(1列)距离替换反映合并操作。当所有样本都合并成一个簇或满足指定的簇的数目时,整个过程结束。层次聚类可以分为两种:凝聚的方式和分割的方式,凝聚是一种至底向上的方法,将每一条记录看作一个类,然后根据

16、一些规则将他们聚合成越来越大的类,直到满足一些预先设定的条件。1 2 3 4执行n-1次步骤2和步骤3-18-网龄2月及以上新增用户细分模型 采用SPSS及CLEMENTINE作为数据分析与聚类建模工具 算法为Two Step 聚类算法 使用细分矩阵,按照语音消费行为和数据业务消费行为两次聚类的方法分别聚类,多维聚类的方法较传统单维聚类方法,聚类后的用户细分特征更明显 聚类数据集为2009年1-9月新增用户入网后第二个月,且第二月状态正常的用户的基础数据和消费行为数据 数据在聚类前需进行标准化变换和极值处理本地通话次数长途通话次数计费通话时长漫游通话次数ARPU低端 中低端长途突出本地突出漫游

17、突出商务GPRS流量新业务费新业务使用种类数 彩信条数 短信条数新业务费占比使用少占比高兴趣 短信突出上网突出发烧友-19-细分群主要消费行为特征(网龄=2个月)-1序号 细分群名称 细分群特征 规模占比1商务高端用户群语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;ARPU最高为240元/户以上,交往圈最大,本长漫语音话务均高,且每次通话时长较长2.4%2漫游突出用户群语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;ARPU为85元/户左右,经常去外地,漫游话务突出,本地及长途话务较少,且漫游通话频次最高3.9%3长途话务突出群语音消费行为相对数据业务消费行为更为

18、突出,为用户主要行为属性;ARPU为120元/户左右,交往圈中有大量外地号码,长途话务突出,漫游很少,且长途通话频次最高7.6%4本地话务突出群语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;ARPU为120元/户左右,交往圈主要集中在本地,本地话务突出,长途漫游较少,且本地通话频次最高4.7%5本地话务偏好群语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;ARPU为67元/户左右,交往圈主要集中在本地,通话时长相对较低,但本地话务相对突出,长途漫游很少14.8%6本地低端用户群语音和数据业务消费行为均较低,用消费户行为相对均衡;ARPU较低为30元/户左右,很少去

19、外地,漫游和长途时长比例最低,平均每次通话时长最短33.5%-20-序号 细分群名称 细分群特征 规模占比7短信突出用户群数据业务消费行为相对语音消费行为更为突出,为用户主要行为属性;ARPU为40元/户左右,数据业务消费占比高于50%,主要使用短信业务,且短信上行条数最高8.0%8GPRS突出用户群数据业务消费行为相对语音消费行为更为突出,为用户主要行为属性;ARPU为30元/户左右,数据业务消费占比高于50%,GPRS流量高,其他数据业务使用较少8.1%9数据业务兴趣群数据业务消费行为相对语音消费行为更为突出,为用户主要行为属性;ARPU为20元/户左右,订购数据业务种类最多,但消费不高,

20、数据业务费用占比高于50%13.3%10数据业务发烧群数据业务消费行为相对语音消费行为更为突出,为用户主要行为属性;ARPU为65元/户左右,订购数据业务种类最多,且数据业务消费最高,占比高达67%3.9%细分群主要消费行为特征(网龄=2个月)-2-21-网龄1月新增用户细分模型 采用SPSS及CLEMENTINE作为数据分析与聚类建模工具 算法为Two Step 聚类算法 使用细分矩阵,按照语音消费行为和数据业务消费行为两次聚类的方法分别聚类,多维聚类的方法较传统单维聚类方法,聚类后的用户细分特征更明显 聚类数据集为2009年10月125日入网,11月1日之前未流失的用户从入网当日至月底的日

21、均消费行为数据 数据在聚类前需进行标准化变换和极值处理低端中低端长途突出本地突出商务占比占比高使用少兴趣 上网突出发烧友日均本地通话次数日均长途通话次数日均漫游通话次数日均计费通话时长日均GPRS流量 日均彩信条数 日均短信条数新业务使用 种类数新业务费占比-22-序号 细分群名称细分群特征规模占比1 漫游突出用户群语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;入网当月ARPU为100元/户左右,经常去外地,漫游话务突出,本地及长途话务很少,且漫游通话频次最高3.0%2 长途话务突出群语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;入网当月ARPU为100元/户左

22、右,交往圈中有大量外地号码,长途话务突出,基本无漫游,且长途通话频次最高4.5%3 本地话务突出群语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;入网当月ARPU为75元/户左右,交往圈主要集中在本地,本地话务突出,基本无漫游,长途很少,且本地通话频次最高7.7%4 本地话务偏好群语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;入网当月ARPU为55元/户左右,交往圈主要集中在本地,通话时长相对较低,但本地话务相对突出,基本无漫游,长途很少12.6%5 本地低端用户群语音和数据业务消费均较低,且二者消费相对均衡;入网当月ARPU为25元/户左右,主要在本地活动,本、

23、长、漫通话时长均为最低,基本无数据业务使用量36.7%细分群主要消费行为特征(网龄1个月)-1-23-序号 细分群名称细分群特征规模占比6 数据业务突出群数据业务消费行为相对语音消费行为更为突出,为用户主要行为属性;入网当月ARPU为30元/户左右,订购数据业务种类最多,且数据业务消费占比高,高达79%21.3%7 GPRS偏好用户群数据业务消费行为相对语音消费行为更为突出,为用户主要行为属性;入网当月ARPU为54元/户左右,GPRS消费最高,远高于其他群,且数据业务消费占比高,高达77%9.2%8短信突出用户群数据业务消费行为相对语音消费行为更为突出,为用户主要行为属性;入当月ARPU为8

24、0元/户左右,数据业务消费占比为65%左右,日平均发送短信10条左右,主要使用短彩信业务,且短信和彩信上行条数均为最高4.9%细分群主要消费行为特征(网龄1个月)-2-24-v 新增用户中的流失用户超过四分之三的用户生命周期不超过四个月,不具有完整的生命周期特征v COX生存分析模型,隐含了一条假设,即在时间越长,其离网的可能性就越大,这样一来,是否离网和在网时间应该是正相关的,COX模型在拟合的时候,会在这个约束之下,所以其对数据的拟合没有LOGIT效果好 因此对新增用户离网预警,采用LOGIT回归模型或决策模型新增用户中的流失用户有76%在入网后的四个月内流失n 流失用户的76%是在入网后

25、的四个月内流失n 分别有22%和23%的流失用户在入网后的第一个月和第二月内流失数据来源:09年1月-10月新增用户流失用户定义:当月停机,且连续停机60天以上用户,到2009年11月仍未开机用户网龄举例:3月入网,3月流失的用户,网龄为0个月流失用户的在网时长分布-25-决策树预测模型:决策树是以实例为基础的归纳学习算法,它着眼于从一组无次序、无规则的实例中推理出以决策树表示的分类规则。它采用自顶向下的递归方式,在决策树的内部节点进行属性的比较,并根据不同属性值判断从该节点向下的分支,在决策树的叶节点得到结论。逻辑回归预测模型:也称定性变量回归,类似于线性回归,但是目标字段使用字符型字段而不

26、是数值型字段。Logistic回归建立一组方程,把输入属性值与输出字段每一类的概率联系起来。一旦生成模型,便可用于估计新记录属于某类的概率。概率最大的目标类被指定为该记录的预测输出值。逻辑回归算法具有训练集和测试集预测准确率的差异是最小的优点 能给出用户属于某类型概率,可精确控制用户群大小 对有缺失值的记录不能给出预测概率 模型自变量之间可能存在多重共线性干扰 业务可解释性较决策树差优点缺点 逻辑回归算法具有训练集和测试集预测准确率的差异是最小可以精确控制筛选用户群大小的 优点,同时我们采用缺失值处理、相关性分析可以规避算法的缺点,优先选用逻辑回归算法。比较模型预测效果,选择预测效果较佳分类算

27、法模型 比较 结论正常低网龄用户流失采用预警分类算法-26-在网2月新增用户流失预警模型n 采用SPSS和CLEMENTINE作为数据分析和建模工具n 分别采用逻辑回归算法和决策树算法建模,比较模型预测效果,确定使用逻辑回归算法 基本情况 语音通话情况 数据业务使用情况品牌 ARPU 余额套餐名称本地通话次数长途通话次数漫游通话次数数据业务费用数据业务消费占比数据业务使用种类数3月 4月 5月 6月 7月 8月 9月 10月 11月3月 4月 5月 6月 7月 8月 9月 10月 11月3月 4月 5月 6月 7月 8月 9月 10月 11月3月 4月 5月 6月 7月 8月 9月 10月 1

28、1月建模时间窗口测试时间窗口入网月份 取数月份流失月份 流失观察月份建模变量-27-建模结果余额通话次数套餐名称本地被叫次数欠费金额本地主叫次数网内通话对端数网外通话对端数彩铃订购标志通话时长大于5分钟标志多次充值标志欠费标志ARPU大于0标志长途通话次数漫游通话次数新业务费通话标志包打套餐标志手机报费用本地主叫通话标志拨打10086次数重入网标志n 所有的数据经过对数变换和标准化变换,消除不同变量和不同月份对模型的影响n 逻辑回归算法使用的方法是进入法,模型调整变量的依据是回归参数的Wald检验,模型拟合优度的评判标准时是-2对数似然值,值越小,拟合效果越好n 模型的结果为对数流失风险比的线

29、性拟合表达式,应用模型时输入为用户当前在建模变量上的值,输出为用户的流失概率n 下图展示了建模变量的重要性(调整后的实际建模变量)变量重要性-28-用户集:09年07月入网、08月仍然正常的用户;模型筛选用户:通过模型筛选出的用户集中20%的用户,其中,包含了用户集中52.2%的9月流失用户;模型筛选用户9月、10月和11月的流失率(模型准确率)分别为16%、34%和48%,比用户集中用户的流失率(不使用模型筛选的准确率)提升度分别为2.4、2.5和3.2倍。52.2%*提升度=模型筛选用户流失率/用户集中用户流失率考察模型筛选用户三个月流失情况,模型准确率为48%-29-在网2月以上新增用户

30、流失预警模型n分别采用逻辑回归算法和决策树算法建模,比较模型预测效果,确定使用逻辑回归算法3月 4月 5月 6月 7月 8月 9月 10月 11月3月 4月 5月 6月 7月 8月 9月 10月 11月3月 4月 5月 6月 7月 8月 9月 10月 11月3月 4月 5月 6月 7月 8月 9月 10月 11月建模时间窗口测试时间窗口建模变量 基本情况 语音通话情况 数据业务使用情况品牌ARPU余额套餐名称月数据 时间段变化趋势数据 月数据时间段变化趋势数据本地通话次数长途通话次数漫游通话次数本地通话次数波动率长途通话次数波动率漫游通话次数波动率数据业务费用数据业务消费占比数据业务使用种类数

31、数据业务费用波动率3月 4月 5月 6月 7月 8月 9月 10月 11月3月 4月 5月 6月 7月 8月 9月 10月 11月3月 4月 5月 6月 7月 8月 9月 10月 11月-30-建模结果余额本地被叫通话次数欠费金额本地被叫次数波动率通话标志通话时长大于5分钟标志多次充值标志其他费用本地主叫次数波动率新业务费通话次数月租费ARPU彩铃订购标志长途通话次数漫游通话次数本地主叫次数n 所有的数据经过对数变换和标准化变换,消除不同变量和不同月份对模型的影响n 回归分析方法和参数设置同在在网2月新增用户流失预警模型n 模型的结果为对数流失风险比的线性拟合表达式n 用户余额、本地被叫通话次

32、数、欠费金额、本地被叫次数波动率、通话标志、通话时长大于5分钟标志变量重要变量重要性-31-模型预警20%的正常用户,包含61%的下月流失用户用户集:09年06月(包括06月)以前入网、08月仍然正常的用户;模型筛选用户:通过模型筛选出的用户集中20%的用户,其中,包含了用户集中61.4%的9月流失用户;模型筛选用户9月、10月和11月的流失率(模型准确率)分别为26.7%、36%和43%,比用户集中用户的流失率(不使用模型筛选的准确率)提升度分别为3.4、2.7和2.3倍。61.4%*提升度=模型筛选用户流失率/用户集中用户流失率-32-在网1月新增用户流失预警模型n在网1月新增用户没有月数

33、据,只有日数据,由于系统只保留最近3月的日数据,9月的日数据不完整,11月的新增用户不能判定用户流失,只能取10月新增用户的日数据为建模数据集n 用户的样本量小,考虑到决策树算法如使用交叉验证,能一定程度上弥补样本量小的不足,采用决策树算法作为预警建模算法建模时间窗口建模变量 基本情况 语音通话情况 数据业务使用情况品牌 ARPU余额套餐名称日均数据时间段日数据/变化趋势数据日均数据时间段变化趋势数据本地通话次数长途通话次数漫游通话次数本地通话次数波动率长途通话次数波动率漫游通话次数波动率短信条数彩信条数GPRS流量短信条数波动率1 2 3 4 5 6 7 8 9 10 11 12 13 14

34、 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31入网时间在10月125日的用户从入网当天直到10月底的日数据-33-建模结果余额品牌手机报费用套餐名称日均长途通话次数月租费日均本地被叫通话次数充值次数日均漫游通话次数包打套餐标志本地通话次数波动率手机邮箱标志新业务费多次充值标志彩铃订购标志手机报订购标志本地主叫次数波动率重入网标志外网通话对端数波动率通话大于5分钟标志通话标志短信发送条数波动率n 模型使用了交叉验证,模型的结果为决策树,应用模型后的输出为用户流失的置信度n 用户余额、品牌、手机报费用、套餐名称、日均长途通话次数、月租费、日均

35、本地被叫通话次数变量重要变量重要性-34-模型预测效果评估n 由于没有11月的数据可用于测试12月流失情况,使用建模数据集评估模型拟合效果n 从收益图来看,模型筛选了20%的10月新增用户,包含了50%的11月流失用户 筛选40%的的10月新增用户,包含了74%的11月流失用户74%50%-35-模型应用流程l 新增用户和高价值用户l 当前在网用户定义候选用户识别正常用户n渠道养卡用户识别模型n 跳蚤用户识别模型筛选流失预警用户用户细分模型根据不同用户特征,采用适宜的挽留策略了解用户特征n在网1月新增用户流失预警模型n在网2月新增用户流失预警模型n在网2月以上新增用户流失预警模型n高价值用户流

36、失预警模型n高价值用户用户细分模型n在网1月新增用户细分模型n在网2月以上新增用户细分模型-36-维 系方 案正常低网龄用户维系措施正常低网龄用户维系在网异动用户 流失高危用户财务捆绑:预存话费送话费(高额度)用户忠诚度计划网龄营销(财务捆绑)服务捆绑用户归位,主动引导用户归位至适合其自身消费的品牌和资费套餐;优惠补卡;账户低余额时充值提醒;主卡付费+亲情网 同一细分群的流失高危用户和在网异动用户采用同一类型的捆绑政策,但在力度上会有所差异。业务捆绑:预存送本地长途通话分钟数业务捆绑:预存送本地通话分钟数(高额度)财务捆绑:预存话费送话费(中低额度)业务捆绑:专项预存-高价值数据业务套餐优惠业

37、务捆绑:专项预存-短信套餐捆绑业务捆绑:专项预存-GPRS套餐捆绑业务捆绑:预存送漫游主叫通话分钟数业务捆绑:专项预存-数据业务套餐优惠业务捆绑:预存送本地通话分钟数(低额度)商务高端用户群长途话务突出群本地话务突出群本地低端用户群数据业务发烧群短信偏好用户群GPRS偏好用户群漫游突出用户群数据业务兴趣群本地话务偏好群全用户-37-谢 谢!-38-9、静夜四无邻,荒居旧业贫。2023/5/142023/5/14Sunday,May 14,202310、雨中黄叶树,灯下白头人。2023/5/142023/5/142023/5/145/14/2023 8:23:27 PM11、以我独沈久,愧君相见

38、频。2023/5/142023/5/142023/5/14May-2314-May-2312、故人江海别,几度隔山川。2023/5/142023/5/142023/5/14Sunday,May 14,202313、乍见翻疑梦,相悲各问年。2023/5/142023/5/142023/5/142023/5/145/14/202314、他乡生白发,旧国见青山。14 五月 20232023/5/142023/5/142023/5/1415、比不了得就不比,得不到的就不要。五月 232023/5/142023/5/142023/5/145/14/202316、行动出成果,工作出财富。2023/5/14

39、2023/5/1414 May 202317、做前,能够环视四周;做时,你只能或者最好沿着以脚为起点的射线向前。2023/5/142023/5/142023/5/142023/5/149、没有失败,只有暂时停止成功!。2023/5/142023/5/14Sunday,May 14,202310、很多事情努力了未必有结果,但是不努力却什么改变也没有。2023/5/142023/5/142023/5/145/14/2023 8:23:27 PM11、成功就是日复一日那一点点小小努力的积累。2023/5/142023/5/142023/5/14May-2314-May-2312、世间成事,不求其绝对

40、圆满,留一份不足,可得无限完美。2023/5/142023/5/142023/5/14Sunday,May 14,202313、不知香积寺,数里入云峰。2023/5/142023/5/142023/5/142023/5/145/14/202314、意志坚强的人能把世界放在手中像泥块一样任意揉捏。14 五月 20232023/5/142023/5/142023/5/1415、楚塞三湘接,荆门九派通。五月 232023/5/142023/5/142023/5/145/14/202316、少年十五二十时,步行夺得胡马骑。2023/5/142023/5/1414 May 202317、空山新雨后,天气

41、晚来秋。2023/5/142023/5/142023/5/142023/5/149、杨柳散和风,青山澹吾虑。2023/5/142023/5/14Sunday,May 14,202310、阅读一切好书如同和过去最杰出的人谈话。2023/5/142023/5/142023/5/145/14/2023 8:23:27 PM11、越是没有本领的就越加自命不凡。2023/5/142023/5/142023/5/14May-2314-May-2312、越是无能的人,越喜欢挑剔别人的错儿。2023/5/142023/5/142023/5/14Sunday,May 14,202313、知人者智,自知者明。胜人

42、者有力,自胜者强。2023/5/142023/5/142023/5/142023/5/145/14/202314、意志坚强的人能把世界放在手中像泥块一样任意揉捏。14 五月 20232023/5/142023/5/142023/5/1415、最具挑战性的挑战莫过于提升自我。五月 232023/5/142023/5/142023/5/145/14/202316、业余生活要有意义,不要越轨。2023/5/142023/5/1414 May 202317、一个人即使已登上顶峰,也仍要自强不息。2023/5/142023/5/142023/5/142023/5/14MOMODA POWERPOINTLorem ipsum dolor sit,eleifend nulla ac,fringilla purus.Nulla iaculis tempor felis amet,consectetur adipiscing elit.Fusce id urna blanditut cursus.感 谢 您 的 下 载 观 看专家告诉

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 考试试题 > 消防试题

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁