数据分析避坑指南-分析思路
1. 概述
作为分析师,需要对数据和结论负责,所以一定要“大胆猜测、小心求证”。如何小心求证呢?笔者看到、也经历过一些“踩坑血泪史”,下面就从定位问题、分析思路的角度,跟大家分享下。
2. 定位问题
在之前的文章《数据分析,竟然这么多套路!》中介绍了一些常见的分析模型,有跟大家重点强调,数据分析的第一步是“确定问题”。
场景一
首先还是老套路,给大家一个选择题:
一个业务同学急急忙忙的找到你,说活动页面的跳出率数据异常,大家觉得第一步应该做什么?
- A.反问活动页是否有调整
- B.查下数据任务是否异常
- C.明确“跳出率”口径
———————10秒钟思考———————
这是比较常见的场景,为了“确定问题”,我们首先需要明确指标的口径,尤其是有分子、分母的指标,更要清晰分子、分母的定义,否则容易导致“定义谬论”,所以答案是C。
这是笔者遇到过的真实案例,当时业务看到的“跳出率”,是“APP跳出率”,即【跳出APP的人数/页面访问人数】,但对于活动页面的场景,更常规关注的指标是“页面跳出率”,即【页面无点击行为人数/页面访问人数】。所以如果一开始指标的定义就没搞清楚,就开始启动探查和分析,很容易导致南辕北辙。
场景二
刚才这道题是不是很简单?现在给大家上点难度。
又是这个业务同学,跟你哭诉:累死累活做了个活动,但是“访问支付率”(PS:支付用户数/访问用户数)竟然还下降了(如下表,非真实数据)。
这时候你会?
- A.一起抱头痛哭
- B.鼓励他继续努力
- C.可能是辛普森悖论,还需探查
选A的朋友,请控制情绪;选B的朋友,请冷静下来先思考下。这个场景,其实是比较典型的辛普森悖论,是否可以根据整体指标的下降、就断定活动效果不好呢?
还得按照目标人群去拆分观察,比如按活跃度拆分(非真实数据):
神奇了是不是,每类用户群的指标都是上涨的了!
这就是辛普森悖论,即分组都较优的情况下、整体却反而会变差,主要原因是分组的占比相差大,占比低、表现弱势的用户群,随着占比提升、会影响整体的表现。
针对这个问题本身,其实本质情况是沉默用户、新用户占比升高,这个就可以结合活动的策略及目标,判断是否是问题再进行分析。
场景三
还是这个业务同学(他的问题有点多hhh),某天突然找到你,神神秘秘地说自己有个大发现:
花卖得越多,店铺的刮胡刀、按摩椅就卖得越多,没想到卖花还能有这作用!自己准备再多卖些花。
这是“相关因果谬论”,误把相关当因果,花和刮胡刀、按摩椅都卖得好,可能是跟父亲节、端午节等节日有关,而不是卖花能导致刮胡刀、按摩椅卖得好。
因此分析师需要深入了解业务,才能探查现象背后的本质,避免发生相关因果谬论类的尴尬。
3. 分析思路
以上是在判断问题时,几种较常见的坑,而对于分析师来说,还有一种更常见的坑,叫“乱七八糟胡乱分析”坑。
之前的文章有介绍过矩阵分析、杜邦分析、交叉分析等方法,而一些分析同学在具体实践时,很容易狂堆各种维度,什么用户画像、商品画像、场景画像,噼里啪啦一堆取数,各种盲目地交叉分析,最后整了个几百M的Excel,但是啥有价值的结论也没探查出,然后开始怀疑人生……
那有哪些方法可以帮助我们梳理思路,或者说明确分析框架呢?常用的思路有以下几种:
3.1 业务流程驱动
业务流程既是了解业务的基础,也是常用的分析框架,需要清楚“结果”是由哪些“环节”导致的,且明晰各“环节”可能与结果相关的因素,就容易探查出相对本质的原因。
例:某商品发生缺货,可以梳理出商品供应的关键节点,评估各个节点上可能的原因,再通过数据去论证。如缺货可能是在做销量预测时即偏低,也可能是下单环节为了控制库转、保守备货,只有梳理清楚相关节点及影响因素,才更容易得到有价值的结论。
3.2 部门职能导向
数据分析是为了明确问题,且定位到具体执行的人或部门,这样才容易推动落地。因此在梳理分析框架时,可按照部门职能,分模块进行分析。
例:活动分析场景,活动分析的维度众多,复盘活动效果最常用的思路之一,就是按活动的负责部门去分类,定位每个部门的好坏、给出相关策略建议,如下图(非真实数据):
3.3 策略目标导向
在做业务分析、尤其是复盘时,分析师经常会遇到无法“判断好坏”,或无法找到分析切入点的情况。很多情况还是归因于“不够了解业务”,既然做分析复盘,还是需要明确业务当时的目标是什么、有哪些策略、策略的方向和目标是什么,以此为基准、确定分析方向,会更加符合客观情况,也更容易与业务达成一致。
例:如下图针对促销活动的分析(非真实数据),可与业务梳理和明确活动目标、策略情况,形成自己的分析复盘的框架:
4. 小结
这次跟大家介绍了在【定位问题】和【确定分析思路】时,常见的坑及解决方法,也希望大家遇到类似的场景时,会多些谨慎、多些思路。
数据分析路漫漫,大家在做分析时有遇到什么坑吗?欢迎分享~
本文作者:九条
以上内容对您是否有帮助?