数据分析与数据科学如何为业务赋能?
我简单给大家做一个自我介绍。其实我跟我们CDA是挺有渊源的。我是CDA LEVEL 3数据科学家的持证人。曾经先后在探探,以及去哪儿网等一些互联网公司作为数据分析和数据产品的负责人。
那么主要在公司负责指标体系的搭建、BI系统的构建、实验分析还有用户画像等等这样一系列跟数据相关的工作。
今天非常高兴能够到这里,跟大家一起来交流关于数据分析师这个岗位和数据赋能相关的内容。
问题 1:
作为一个拥有10多年的数据分析工作经验的资深分析师,可以给我们介绍一下互联网企业中数据分析和数据科学都是从哪些方面赋能给业务的吗?
//
嘉宾:
以我个人的工作经验来讲的话,互联网企业里面对于数据赋能,其实主要分为两个大的方面。
第一个大的方面其实是数据诊断。
所谓的数据诊断就是在构建完一套比较合理的指标体系的基础上,我们去通过数据发现问题、诊断问题,帮助找到业务上发展不好的章节。这个叫数据诊断。
数据诊断里面其实我归纳一下有两字诀:
第一个字就是“拆”。大问题拆成小问题,难问题拆成简单的问题。
像平时的这个金字塔原理。
还有漏斗思维,然后这些其实都属于拆分的思维。
第二个字其实是“比”。指的是各种比较。
比如说可以通过帕累托原则跟我们自己比。找出真正能解决80%问题的20%的这些小的点。
另外还可以根据行业比,跟其他的类似的要点比。
所以说,数据指标体系构建的基础上的一个拆一个比。这是数据诊断方面。
另外一个方面,其实是数据策略应用。
我们企业一般会积累很多数据,这些数据是数以TB级的,所以这么大量的数据如果没有形成策略,没有形成应用那是非常可惜的。
或者是我们可以依靠数据构建用户画像,对用户做一些差异化的策略。然后千人千面,让我们的企业能够有更好的效果。
问题 2:
能举个例子吗?比方说业务数据的诊断过程当中,昨天的日活量它下跌了30%,今天的这种转化率成交量还不超过1%。
//
嘉宾:
业务诊断在数据分析师日常工作中是非常非常重要的一个点。
刚才我也提到了,对于业务诊断的第一步其实是拆,第二步是比。
我们其实就用我刚才提到那个拆的思路来就是应对一下海龙老师这两个问题。
比如说DAU某一天跌了30%,那首先我们就要想到,怎么样把这个30%的下跌量拆分到不同的一些简单的维度或者问题中去。
打个比方说其实可以用DAU的公式去拆解。
DAU=DNU+留存的用户+回流的用户。
所以 DAU 无非是这三个部分组成的。
做了第一层拆解之后我们就要看,DAU 下跌30%是新增用户贡献多少,留存用户贡献多少,回流用户贡献多少。针对这三个不同的用户的原因,其实我们可以进一步拆解。
如果是新增用户对下降贡献的比例比较大,我们需要看哪一个新增渠道下降最多,那么去做进一步拆解。
如果是留存的数据下降比较大,那么这个时候我们需要去做的一件事情是什么呢?
首先需要看是哪一个人群留存下降特别多,或是哪一个手机平台,iOS或者PC端哪个下降比较多。通过这种拆解的方式,一步一步接近真相接近重要的答案。
通过这个方式我们就能够了解到 DAU 下降30%的原因最具体归因于是在哪一块。
这是王老师的第一个问题,我们再来看第二个问题,就是转化率。
从浏览页面到购买下单的这个转化率不超过1%,这个怎么解决?
仍然是第一步是拆,只不过在这里的拆我们可能又要用到另外一种工具,就是漏斗拆分。
我们可以思考,从浏览页面到下单,其实一共可以分成4个步骤。
第一步是浏览页面,第二步是商品详情,第三步是下单,第四步是支付。
可能经过这4个步骤,每一个步骤它其实都是一个漏斗。漏斗的环节率转化越低,越是我们需要关注的环节点。
比方说,我们从浏览到详情页的转化率低,原因大概率是推荐算法或者推荐策略不奏效。没有推到这个用户比较喜欢的商品,所以用户不会点击。
如果修复了、优化了算法之后,这个转化率就会有所提升。
再比如说如果已经下单了,还没有支付。
那这种情况下,第一个要不然用户可能手头不是特别宽裕,这个时候可能会给他一个补助的优惠券辅助他下单,那么另外可能就是我们的下单接口到支付接口是不是有一些bug,会有一些问题。如果一旦修复,这个转化率也上去了。
因为漏斗分析它各环节之间是一个乘数的关系,每一个环节的转化率是一个乘法的关系。所以你每优化一个环节,都会使你的转化率有一个非常大的提升。
主持人:
其实听了曾老师这个介绍,我就是听到了两个字,第一个字就是“拆”,第二个字还是“比”对。
就是你先拆找到原因,然后在这个原因的基础上你去对比说哪个的这个得分降低最大,在那个基础上我们再去修复你的这个规则,指标体系选择的合理与否,直接影响到这个评判的标准。
问题 3:
那我们该如何搭建一个这种科学的指标体系呢?
//
嘉宾:
这确实是非常重要的一个问题。
其实我们大家可能会认为,指标体系是一个非常基础的事,可能并不是特别难,但是实际上它对于我们数据分析来讲是一个非常重要的事。
因为巧妇难为无米之炊,如果没有指标体系的话,后面所有的分析都是搭建在一个空中楼阁的基础上。
正常的在企业中,从零搭建一套指标体系可以有一个模型可以借鉴,这个模型我们把它叫做 OSM 模型,它实际是将目标、战略和度量三个单词的首字母结合到一起作为这样的一个模型。
O 就是目标。第一步就是找到我们的目标,俗称北极星指标。所有的业务动作,都需要围绕这个北极星指标去贯彻。
比如说淘宝,它肯定是以 GMV 为北极星指标。再比如说Facebook,Facebook它是一个社交网络,所以它的北极星指标是一个用户量。
什么样的指标适合做北极星指标呢?
那必须是满足两个方面的条件:
第一个是满足用户价值。也就说这个北极星指标必须能够体现用户对产品或者这个业务的喜爱程度,这是第一个方面。
第二方面它必须满足我们企业的商业价值。也就是说如果这个北极星指标上涨,企业就能够挣到更多的钱。
第二步就是策略。其实我们围绕实现北极星指标提升这个目标,我们需要订立很多的策略。这个策略就是我们制定指标体系的关键。
比方说,我的公司如果让 DAU 作为我的北极星指标,那么我的策略无非有三条。
第一个是拉新增,就是让大量的这个新增用户来我的这个产品上体验。
第二个策略是促留存,让用户留下来。
第三个是回流召回,这个时候我们的指标可能要围绕这个新增用户 DNU 和这个留存用户的这个留存率,以及回流用户的数量,这样一些数据指标来进行构建。
OSM中M实际上是测量,就是说我们要找到可以计量,并且容易操作的指标来考量我前面说的策略是否执行得好。
这个是我们构建一套指标体系的方法。
另外在增长黑客领域,还有一些非常著名的指标体系。
比如说海盗法则,这也是我们能够在这个构建指标体系的时候参考的一些依据。
问题 4:
您刚才也提到了数据赋能业务这一方面的这个策略应用,就是您能详细的举一个例子或者说明策略应用的内容吗?
//
嘉宾:
其实数据应用在我们互联网企业里面有很多体现。
首先我想举的一个例子是用户画像。
用户画像其实我们大家其实都比较了解。它能够给企业带来千人千面的策略,为用户提供更加个性化的体验。
比如说我们身边都能接触到的抖音和快手,通过用户画像和推荐策略是能够让我们体验出那种沉浸感。
然后再比如说视频网站。通过分析用户画像和历史数据,能够知道你更喜欢哪位明星。
用画像的好处是能够用非常少的成本为我们去获得比较大的产品收益。
另外,在这个增长黑客里面还会经常提到的一个概念,就是魔法数字。
如果一个用户能够在我们运营的体系的引导下完成这样一个数字,他就能够见证我们产品和业务的美好,他就会留下来继续使用我们的产品。
比如说Facebook,他们的分析师通过分析数据就发现新增用户在注册7天内加了10个好友,那么他就会长期留存在他们的平台。
有了这样魔法数字,运营或者产品的同事就能够设计一些打卡活动,然后或者设计一些产品功能引导用户完成这个魔法数字,最终成为我们的忠实用户。
还有一个场景就是AB测试。
比如说产品经理认为,我们的文案这样设计可能会带来更多的转化率,那么他没有量化的支撑,他只是凭自己对产品的经验和认知得出这样的结论。
但是,如果数据分析师帮助他们用AB测试的方式去,测一下就能够告诉他你用这个文案能够提升3%的转化率,能够非常直观和量化的给予他迭代的结果和依据。
问题 5:
在深耕数据领域的这几年,您感触最深的是什么?然后有哪些成就感,同时又遇到了哪些挫折呢?
//
嘉宾:
有两点感触是相对比较深的。
第一个感触就是数据分析也好,数据科学也好,这个岗位实际上是终身学习的岗位,并不是说可以一蹴而就的。
无论是你在工作第几年的时候,都需要有这种学习的心态。
比如说最近出了ChatGPT,然后也非常火。基本上能够未来大有取代搜索引擎的趋势。如果不学习这样东西,不保持长期的这样学习的心态,是很容易落伍的。
第二个点人与人的差异,企业与企业差异是非常之巨大的。
人与人的差异我举个例子,其实数据分析师这个岗位来讲,是易学难精的岗位。
入门非常简单,可能你通过Excel或者通过SQL这样一些很简单的工具,你就能够成为初级的数据分析师。
但是你要到了真正能够去影响业务,能够达到比较高层次分析师的水准,其实是需要很多的努力,才能达到的。
第二个就是,企业与企业之间的差异也非常之巨大。
有些企业数据库里面有数以TB的数据,但是没有应用。所以在企业从数据到应用的这个过程中是有gap的。
这个gap你要跳过去是惊险的一跳,那么在这个过程中必须需要产品经理、运营、数据分析师以及企业领导能够通力合作,才能够使企业完成这样数字化的跳跃过程。
刚才王老师提到了最开心的或者最有成就感的事情是什么,那一定是自己的数据洞见和数据分析的结论为起为业务所用,能够起到真正的作用。
那其实最大的挫折也是我们分析了半天,最后没有用上,没有起到实际的业务效果。
所以说作为数据分析师这样一个岗位来讲,他的喜怒其实是跟业务应用息息相关的。
主持人:
最近曾老师也上架了一本新书《数据分析实战——方法、工具与可视化》,您是什么样的契机激发写这本书的呢?
嘉宾:
其实我写这本书跟我个人的这样一个工作经历是息息相关的。
因为刚才提到,我其实并不是一个科班出身的数据分析师。我其实是一个文科生。
所以我一路从数据分析这个岗位走过来,我知道一个数据分析师从初中级走到高级他需要做些什么。
所以我希望给大家写这样一本关于实践的书,尤其是关于初、中级数据分析师,或者是非我们数据分析行业,想了解这块内容的这样一些读者。这是写这本书的初衷。
第一个方面就是希望这本书能够大家拿起来看就懂,并且其中有260张图片,毕竟图片还是传达信息最快的方式,所以整本书要做到第一个点。
第二个就是翻开看就能用,这本书里面有50多个案例,都是一线互联网企业中
最直接,最接触到这个前沿的这样一些案例。
主要的覆盖对象其实是三类人。
第一类的人,刚才提到初、中级数据分析师想要让自己的理论和工具真正应用到业务上的这一类人。
第二类其实是我们这个其他岗位上想要通过数据赋能,来帮助自己提升业务效果的产品经理或者运营这样一部分人。
第三类这本书还比较适合于学校中的学生,将来想从事数据分析工作的学生。因为里面的很多,这个实战和工具以及理论是大家直接在面试的时候就能够用到的。
主持人:
那其实像曾老师今天说的这个内容,我们在这本书里面都有讲到大家喜欢这本书的可以去京东和当当去搜。谢谢大家的观看。
免责声明:
本文转载自【CDA数据分析师】 张新厂,版权归原作者所有,如若侵权请联系我们进行删除!
易知微以自主研发的EasyV数字孪生可视化搭建平台为核心,结合WebGL、3D游戏引擎、GIS、BIM、CIM等技术,协同各个行业的生态伙伴,围绕着数字孪生技术、数字驾驶舱和行业应用,共同建设数字增强世界,帮助客户实现数字化管理,加速数字化转型。
易知微已经为3000+ 客户提供数字孪生可视化平台和应用,覆盖智慧楼宇、智慧园区、智慧城市、数字政府、数字乡村、智慧文旅、工业互联网等众多行业领域,包括国家电网、移动云、中交建、中铁建、融创、云上贵州、厦门象屿、天津火箭、上海电视台、金华防汛大脑、良渚古城遗址公园、李宁、浙江大学等典型案例!