为了更好的理解用户,洞察用户的需求,数据分析就能很好的帮助解决这个需求。但是在数据分析时,没有思路该怎么办呢?对此,本文从整体思考框架5W2H、描述问题现状对比分析等七个方面做了分析,希望对你有所帮助。
对于产品经理来说,产品的每一次迭代和升级,都需要评估效果,以便今后改进。如果仅仅是凭借肉眼观察和主观感受,下一个“用户反馈很好”、“用户很喜欢这个新功能”类似的结论,是很苍白无力的。更多时候,会因为主观感觉而产生误判,另外,数据分析还可以帮助产品经理更好地了解用户,洞察用户的需求。
而对于运营而言,作为与用户和产品接触最频繁的人,也是策略的制定者和实施者,但产品运营的好与坏,最直观的体现就是数据,通过数据的高和低作为衡量的一个标准。对于运营来说,数据产生和决策制定中间,一定还有大量可以优化的空间,这种空间很大程度上可来源于数据。从数据中发现知识,优化决策,将会成为大大提升运营效率。
所以,无论是产品还是运营,在数据驱动业务的大背景下,数据分析都是必须要掌握的一项技能,本文介绍了7种常用的数据分析方法,介绍了一个完整的数据分析过程中可能用到的系列方法:
从界定问题→诊断现状→定位问题环节→追溯问题原因→判断问题发展趋势。
一、整体思考框架:5W2H
著名教育学家陶行知先生曾经写过一首小诗:
我有几位好朋友,曾把万事指导我,
你若想问其姓名,
名字不同都姓何,
何事何故何人何时何地何法,
好像弟弟和哥哥,
还有一个西洋派,
姓名颠倒叫几何,
若向七贤常请教,
即使笨人不会错。
这首小诗讲的就是5W2H:What(何事) When(何时) Where(何地) Who(何人) Why(何故) How(何法) How much(何几),5W2H是对目标计划进行分解和决策的思维框架,它对要解决的问题进行完整的刻画,以便清晰地界定问题并找到解决方案。
What:何事?发生了什么?一般用来指的是问题是什么?是否真的发生了?比如DAU真的下降了吗?;
When:何时?在什么时候发生的?问题发生的时间,比如DAU下降了,下降的具体时间是什么?是不是节假日等等;
Where:何地?在哪里发生的?问题发生的拆解其中一个环节, DAU下降了, 是哪一个的地区的下降了,哪个终端的用户下降了?还是哪一个功能的使用的人下降了等等;
Who:何人?比如DAU下降了, 是哪一部分的用户群体在降, 是什么年龄、 性别、活跃度的用户等等;
Why:何故?为什么会这样?问题发生的原因猜想, 比如android用户的DAU降低了, 其他终端的DAU没有降低, 是不是android新发版本存在bug;
How:何法?明确上面的问题后, 我们要采取什么样的方法和策略去解决DAU下降的问题;
How Much:何几?做到什么程度?DAU下降了以后, 我们对应策略的成本是多少, 以及我们要把这个问题解决到什么程度才可以;
5W2H分析方法从问题出发,有一套科学完整的分析思路,对造成问题的原因进行推测,并提出相应的解决方案,最终解决问题,形成闭环。
当然,5W2H只是一种思维方式,在实际应用过程当中可能还会遇到各种各样的业务场景,针对不同的业务场景,整体的思路是一样的, 但分析的维度就需要根据不同的产品形态和业务特性来调整。
二、描述问题现状:对比分析
通过5W2H已经有了整体的思维框架,形成了大致的分析思路,接下来就要针对问题进行具体分析,首先从问题现状入手。
没有对比,就没有优化提升的方向。在数据分析中,没有对比,就没有结论。
比如,小虎某次期末考试的成绩不好,数学只得了 40 分。
小虎的妈妈对他说:“你上次考试数学考了 70 分,这次怎么就考得这么差?你看你的同班同学,这次都考 80 分以上。我之前跟你说考90分给你买奥特曼,这下别想了……”
常见的对比思维有以下 5 种:
1.跟目标对比:本月目标销售额500w,实际完成了300w,目标达成率60%;
2.跟上个月比:上个月销售额200w,环比增长50%;
3.跟去年同比:去年同期销售额400w,同比下降25%;
4.分渠道对比:线上/线下渠道销售分别200w、100w;
5.跟同类竞对比:同水平竞对A、B、C本月销售额分别为600w、500w、100w;
总结一下上面的对比思维,主要是横向和纵向对比:
横向对比:同一时期,外部和竞对比,内部各渠道对比
同一时期和外部竞对对比,整体市场表现以及所占市场份额变化;
同一时期自己内部各渠道对比,看销售额贡献和贡献占比变化;
纵向对比:自身不同时期对比
和上一期数据对比,近期有无提升/后退;
和去年同期对比,季节周期性考量下对比,是否有提升/后退;
数据分析的过程,就是在明确目标之后,通过对比等思维,找到问题的原因,得出分析的结论,提出可行的建议,从而起到帮助决策和指导行动的作用。
三、定位问题环节:漏斗分析
已经通过横向、纵向对比大致了解了业务的现状,知道业务是在变好/变坏,以及变好/变坏的程度,如果业务在持续变坏,我们就需要通过漏斗分析来定位问题到底出现在哪个环节上。
漏斗模型,本质是分解和量化,这里以电商购物漏斗模型举例。
也就是把购物的整个流程拆解成从选购商品到最终转化成购买的一个个子环节,用相邻环节的转化率/流失率来量化每一个环节的表现。所以整个漏斗模型就是先将整个购买流程拆分成一个个步骤,然后用转化率/流失率来衡量每一个步骤的表现,最后通过异常的数据指标找出有问题的环节,从而解决问题,优化该步骤,最终达到提升整体购买转化率的目的,整体漏斗模型的核心思想其实可以归为分解和量化。
漏斗分析其实是一种业务流程拆解和量化的思路,任何业务流程都可以按照这个思路来拆解,常见的业务漏斗模型还有很多:消费者行为AIDMA漏斗、用户生命周期的AARRR等。
四、细分分析原因:细分拆解
通过漏斗分析我们大致可以定位到问题出现在哪个环节,但是,到底是什么这个环节的哪个部分出了问题,我们还需要进一步细分拆解定位问题症结所在。
在数据分析中,细分是数据分析的灵魂,没有细分拆解,就没有数据分析。
小虎期中考试的总成绩不好,细分一看,发现其他科目的成绩都不错,只有数学成绩特别差,只得了 40 分,而且三角函数一题都没有做对。
常见的细分方法有以下 5 种:例如本季度的销售额没有达标,可以按照以下思路进行细分:
按时间细分:哪个时间段的销售额出了问题?
按空间细分:哪个区域的销售额出了问题?
按过程细分:售前导购、购买体验还是售后服务的哪个过程出了问题?
按公式细分:GMV=流量*转化率*客单价,流量、转化率和客单价的哪个部分出了问题?
按模型细分:用户价值分层模型,不同价值的用户的销售额贡献,是哪类用户出了问题?
拆解的方式千千万,在运用细分拆解思维的过程中,要做到有的放矢,围绕数据分析的目标,找到合适的拆解方法,否则只能无头苍蝇一样到处乱撞。
另外,当发现数据异常时,尝试从不同的维度进行细分,这样既能锻炼数据分析思维,又能加深对业务的理解。
五、寻找相关因素:相关性分析
如果一个变量改变的时候,另一个变量也朝着相同的方向发生变化,那么我们就说这两个变量之间存在相关性。
分析一家商场的产品销量数据发现,尿布和啤酒的销量会出现大致相同的变化趋势,啤酒和尿布有什么关联呢?采访小虎的爸爸,他说自己下班后,给小虎的弟弟买尿布的同时,也会购买自己喜欢喝的啤酒。
相关性分析,就是寻找变量之间相互关联的程度,相关性一般通过相关系数衡量。最常用的是用于计算线性相关系数的Pearson相关系数,取值区间在1到-1之间。1表示两个变量完全线性相关,-1表示两个变量完全负相关,0表示两个变量不相关。数据越趋近于0表示相关关系越弱。
用Excel进行简单的相关分析,通常包括以下 3 个步骤:
1.收集相关数据
2.绘制散点图形
3.计算相关系数
需要注意的是,相关性不等于因果性。两个变量之间相关性,并不代表其中一个变量的改变,是由另一个变量的变化导致的。
比如说,分析发现,国家的诺贝尔奖数量,与巧克力消费量之间呈现正相关关系,但这并不是说,多吃巧克力有助于获得更多的诺贝尔奖。一种合理的解释是,诺贝尔奖的数量与巧克力的消费量,很可能都是由其他变量导致的,例如国民的受教育程度和富裕程度。
六、溯源影响因素:归因分析
实际业务中,很多问题的出现并非是单个因素造成的,而是经过多种因素的影响而共同造成的。
所以数据分析最头秃的问题就是:导致问题的原因到底是什么?归因分析(Attribution Analysis)要解决的问题就是多因素影响的情况下,最终效果的提升/下降,应该如何合理地分配给过程中的各个因素。
小虎在手机上看到了朋友圈广告发布了最新的iPhone,午休的时候刷抖音看到了有网红在测评这款手机,下班在地铁上刷朋友圈的时候发现已经有小伙伴收到手机在晒图了,于是喝了一杯江小白壮壮胆回家跟老婆申请经费,最后老婆批准了让他去京东买,有保障。那么请问,朋友圈广告、抖音、好友朋友圈、京东各个渠道对这次成交分别贡献了多少价值?
现实情况往往是很复杂的,在衡量其贡献价值时,只依靠单渠道归因分析得到的结果是不科学的,需要引入多渠道归因分析。常见的多渠道归因分析模型如下:
末次归因模型:将功劳100%分配给成交前的最后一个环节
首次归因模型:将功劳100%分配给第一个环节
线性归因模型:将功劳平均分配给过程中的每个环节
时间衰减归因模型:距离最终结果时间越短的环节,可以获得越多的权重
位置归因模型:第一次和最后一次环节各贡献40%,中间的所有环节平分剩下的20%贡献
自定义模型:根据自身业务的需求,自定义各环节分配比例
没有完美的归因分析模型,任何模型都存在它的局限性和不足,如何有效地结合使用场景和模型特点是用好归因模型的前提。
七、预测变化趋势:预测分析
了解完问题的现状,定位到问题的原因后,我们还需要预测问题接下来的发展趋势。
另一方面,在各行业各领域,只要有核心的业务指标,都要预测核心业绩未来的走势,销售,市场营销,运营,财务等,一方面可以对未来的发展趋势有个大致的掌握,另一方面也可以提前规划,设定各子部门的KPI,以便尽可能地完成或者超过KPI,所以,如何准确地预测核心指标的变化趋势非常重要。
什么是预测?用最简单的术语来说,它是在分析过去和现在的数据,进而预测未来的过程。我们主要根据时间序列数据进行定量预测。我们通过一个案例说明时间序列数据的主要组成。
如下是各年搭乘飞机飞行乘客数量的趋势。
1.趋势性:趋势是事物发展或变化的总体方向。在上面的例子中,我们看到时间序列呈增长趋势,这意味着在搭乘飞机飞行的乘客数量整体趋势上是在增加。如下图中第一张图所示。
2.季节性:在上述时间序列中可以看到的另一个清晰的模式,就是该变化趋势以固定的时间周期重复,我们称为季节性。在特定时间周期内重复出现或重复的时间序列中任何可预测的变化模式都可以说是季节性。下图中第二张图所示。
3.随机性:去除趋势性和季节性后,剩下的就是一些随机的、无任何规律的白噪声。下图中第三张图所示。
时间序列预测的模型有很多,主要归为以下2类:
(1)传统预测方法
AR(Auto Regressive Model)自回归模型
MA(Moving Average Model)移动平均模型
ARMA(Auto Regressive and Moving Average Model)自回归移动平均模型
ARIMA(Auto Regressive Integrate Moving Average Model)差分自回归移动平均模型等
(2)现代预测方法
基于机器学习方法、深度学习的预测方法。对于机器学习方法,xgboost,随机森林及SVM这些都是可以用的,也没有说哪个模型好用,需要看具体的场景及实验,总之就是看效果说话。
(3)用Excel也能做预测
黑猫白猫,能抓住老鼠的就是好猫,不需要复杂的算法和模型,用Excel也能做简单的预测。
大学生竞赛活动,需要帮助的同学,联系我们,给您提供报名、参赛培训等服务。