数据分析:结构比率归因、量化异常分析.docx

上传人:太** 文档编号:86437374 上传时间:2023-04-14 格式:DOCX 页数:14 大小:26.70KB
返回 下载 相关 举报
数据分析:结构比率归因、量化异常分析.docx_第1页
第1页 / 共14页
数据分析:结构比率归因、量化异常分析.docx_第2页
第2页 / 共14页
点击查看更多>>
资源描述

《数据分析:结构比率归因、量化异常分析.docx》由会员分享,可在线阅读,更多相关《数据分析:结构比率归因、量化异常分析.docx(14页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、数据分析:结构比率归因、量化异常分析我们来看下面一个场景,表一是2020和2021年不同用户群体的用户数,以及 对应群体的付费率。表二是2020年和2021年总体的付费率下降了 2.8%0想问一下,我们通过表一如何分析原因?付费率=付费人数/总人数表一:召回用户46召回用户付20%17%新注册用户数活跃用户数2020年4922021 年6188新注册付费率活跃用户付费率2020年14%21%2021 年16%18%表二:用户数安卓1600付费用户120数付费率7.5%IOS35001002.9%汇总5100220安卓80005006.3%IOS2000402.0%从表十一我们很快得到表十二的数

2、据。表十二:安卓2020160020218000比率安卓付费率20207.5%20216.3%差异-1.2%结构安卓占比202031.4%202180.0%差异48.6%安卓比率变动-0.7%结构变动3.4%总变动1.1%结论:从表十二,我们可以看出主要是由于安卓的占比上升导致整个付费率的上 升。写在最后:感谢怡然同学的合作和支持。整体付费率差异2020年20.7%2021 年17.9%-2.8%一.付费率下降原因定位1 .结构占比变化由上表一我们可以算出来各个用户群体,在2020年和2021年结构的占比,以及占比的变化:表三:2 .比率付费率变化由上表一我们又可以算出来各个用户群体在2020

3、年和2021年付费率的变化:新注册付费率活跃用户付费率召回用户付2020年14%21%20%2021 年16%18%17%差异2%-3%-3%3 .整体付费率变化的贡献值通过表三和表四,我们可以得到各个群体比率变动和结构变动对于整体付费率变 化的影响大小,见表五:表五:召回月-0.11-0.19新注用户活跃用户比率变动影响0.07%-2.79%结构变动影响-0.15%039%总的付费率变动=0.07%+(-2.79%) + (-0.11%)+(-0.15%)+0.39%+(-0.19%) = -2.8%o与上面表二的结果是一样的。4 .结果解读通过表五得出来的结果,我们可以看到总体付费率的变化

4、是由于活跃用户付费率 的下降,导致了整体付费率的下降。那么,我们是如何得到表五的数据呢?二、分析结构比率问题接下来是一段长文推导,如有不适,忍着看完,进行思考。假设各群体的占比和付费率如下:表六:活跃.召回+新注+2020。用户数占比,吟2021.用户数占比,1;.明.差值。W;-.W2020 q付费率。AB。AB2。2021.付费率.AB;,限Q A S ; /差值.AB - AB1.48) AB每一局部(群体)变动的计算:比率(付费率)变动影响:公式loW + %2%舄亘结构占比变动的影响:公式2。(町一名)AB + ABr1.如何理解我们是希望把总的比率(付费率)变动分解为不同维度(用户

5、群体)比率变动和结 构占比变动,这样我们就能够方便的看出:1 .到底是这个群体比率上升下降的原因,还是说这个群体的占比上升下降导致整个比 率的上升下降;2 .看整个比率变动的主要原因和次要原因,对其进行量化。说完目标,接下来看看具体公式的理解。2 .比率变动的影响主要是量化活跃用户比率(付费率)的变化对于整体比率(付费率)变化的影响, 我们使用ABl-ABl ,这是活跃用户比率变化的绝对量。但是我们考虑的是对总体比率变化的影响,所以需要乘以活跃用户占比,但是活 跃用户占比是在变化的,这里我们就直接乘以(wr-wi) /2,使用均值来稳定 占比的变化。这样我们就计算出来了活跃用户比率变化对于整体

6、比率变化的影响了。3 .结构占比变动的影响公式1仅计算出了活跃用户比率变化对于整体比率变化的影响我们还需要考虑 活跃用户结构的变化对于整体比率变化的影响,所以就有了公式20公式2的理解跟公式1 一样,考虑活跃用户结构变化的绝对量,然后乘以稳定的比率。单个群体(活跃用户)变动计算:公式3。这样我们就能得到单个群体变动对于总体变动量:,+, AB + ABr缶因 _ AB J2 - + (阳-名)-.1 1=- (AB;% + ABW1 - AB -+ ABW - ABWr2 Z即,XABW; - AB、同理所有的变动就是各个群体变动相加:公式4。AByW - 48W1 + AB2W2 _ AB2

7、W2 + 4BW - AB3W3 ,=4用明 + ZB)明 + A例他-(XFiVVi + AB2W2 + AB3W总体变动:假设总体用户为a,那么总体付费比率AB可表示为:公式5。发生 AB 的用户数 Wra - AB + lV2a - AB2 + W3a AB3 AB =总用户数Q即:公式6OAB = W1AB1 + W2AB2 + W3AB3.乂因此:公式70ABW; + /尻回 一(ABMi + AB2W2 + AB3W3 = ABr - AB.所以,总的比率(付费率)理论上就是等于各个群体的比率变动影响和结构变动影响相加。接下来就是一个分渠道购买率定位问题的案例,以及对于辛普森简单理

8、解。三.案例1分渠道购买率-定位三板斧表七:安卓IOS小程序2020年2502005502021 年900700400安卓付费率ios付费率小程序付苫2020年60%60%30%2021 年58%70%40%1.算出每个群体比率和结构差值表八:2020年安卓付费率60%2021 年58%差异-2%安卓占比2020年25%2021 年45%差异20%ios付费率60%70%10%I0S占比20%35%15%2.计算每一个渠道的贡献表九:比率变动影响结构变动影响总变动安卓-0.7%11.8%15.1%I0S2.8%9.8%3.单独计算总付费率表十:2020年付费率43.5%总结:2021年付费率总变动58.6%15.1%我们从表九可以看到:主要是由于安卓端占比的上升,以及IOS占比上升导致总体的付率从43.5%上升到58.6%四,案例2辛普森悖论的理解什么是辛普森悖论:当人们尝试探究两种变量(比方新生录取率与性别)是否具有相关性的时候,会 分别对之进行分组研究。然而,在分组比拟中都占优势的一方,在总评中有时反 而是失势的一方。例如表十一,总体的付费率是在上升,但是安卓和ios的付费率都是在下降。表十一:

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 解决方案

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁