大数据分析师是如何提升数据敏感度,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。
成都创新互联公司专注于碧江网站建设服务及定制,我们拥有丰富的企业做网站经验。 热诚为您提供碧江营销型网站建设,碧江网站制作、碧江网页设计、碧江网站官网定制、小程序定制开发服务,打造碧江网络公司原创品牌,更为您提供碧江网站排名全网营销落地服务。
大家有没有特别羡慕和害怕过这种人,他能一眼看出你做的 PPT 里面的数据异常,随时能提出一个数据证明你的小结论有问题,然后以一个数据问题迅速推翻你整个报告的结论,结果就是你做了整整一个月的分析,全毁了,从头再来。
这样的人逻辑性极强且对你的汇报有生杀大权,最重要的是他有极强的数据敏感度。
那么,什么是数据敏感度?
所谓的数据敏感度,其实就是在大脑内建立了数字和业务之间的联系,而优秀的数据敏感度,就是能够一眼看出数据的问题和背后可能的原因。
什么叫一眼看出?
如果你是游戏行业的,我告诉你这款MMORPG的次留是20%,你能知道我款产品在行业里处于什么样的水准,游戏前期可能存在什么样的问题等;
如果你是O2O行业的,我告诉你外卖订单量相比于昨天下跌了10%,你能很快判断出问题的影响面和造成订单量下跌的可能原因;
如果你是电商行业的,我告诉你我这款产品的复购率是40%,你能很快判断出我这款产品大概是什么类型的产品,在行业内是什么样的水准;
做到这程度,就叫优秀的数据敏感度。如何提升数据敏感度呢?
秘籍:熟悉业务
数据敏感度练成的基础是一定要对业务非常熟悉,无数次的推测及验证都是有用的宝贵经验。
接下来我会根据分析师数据敏感度高的三个表现来给出提升数据敏感度的方法。
⒈如何快速判断数据是高了低了还是错了:熟记关键指标的大数、观察趋势、紧盯异常值
这种快速判断是基于平时对业务数据的熟记与使用的,请相信每个人的记忆力有好坏之分,但是只要下功夫,熟记业务的关键指标,了解他们的基本规律,经过一段时间的积累,你看这些数据的时候肯定会觉得胸有成竹。
记忆数据的技巧也是有的,不需要记全,只需要把关键指标的大数记下来,忽略小数,每天早上养成看报表的习惯,观察趋势,盯紧异常数,多看一些别人是怎么分析异常原因的案例。慢慢地,对各项数据有了基本概念之后,理解数据背后的业务逻辑关系,这样在阅读报表时也能很快发现异常值,及时进行追踪。
但是对于想转行的新人,或者说应届生来说,这个时候还没有接触到具体业务的机会,怎么办?
对于新人或面临转行的人来说,这两种类型的人都缺少对本行业的通识,第一件要做的事就是背数据,记住这个行业的行业平均数据和各项通用指标的定义,这么做是为了对整个行业有个总体的认知。
比如游戏行业,可以查询应用宝、360、硬核等各家平台发布的游戏数据,对市面上的各种游戏类型的留存、付费等数据有一个整体的整理和记忆,比如 Arppu、Arpu、次日留存、三日留存、七日留存、月留存、付费率等等。
比如电商行业,流量*转化率*客单价*复购率这个公式则是重中之重等等。
⒉知道所有指标是怎么来的,知道它们的意义以及相互的关系,进而判断数据异常的原因
提升敏感度的时刻想着三个问题:
❖数据怎么来的?
理解业务,分析溯源,同时也要判断数据来源的可靠性
❖指标维度有哪些?
理解评估标准,不同业务有不同的关键业务指标,利用思维导图积累相关业务的指标体系,多总结多问为什么;指标体系经常用于数据细分找原因,知道数据构成才能更快地拆分数据,找到异常原因。
❖数据如何说明业务?
指标在业务中的应用,业务数据正常水平是怎么样的,受节假日或者活动营销的影响的数据又是怎么样的,要多对比,结合环比同比明白数据高低的意义等。
⒊拿到数据,能够根据分析目标很快理出分析框架,得出结论。
假如你是百度外卖的运营负责人,某天移动端的订单量比前一日下降了 5%,你的老板要求你对这一变动做出合理解释,你如何应答?
其次先明确指标变动的异常程度和影响面,订单量比前一日下跌 5%,是否大到必须加以重视。
以 2015 年百度外卖 B 轮融资计划书展示的数据看,其拥有 3000 万的注册用户,日订单数量超过 110 万,客单价可达 50 元左右。以此数据估算,假设 2016 年底注册用户数达到 6000 万,日订单数据量突破 200 万,客单价基本不变,那么 5% 的订单量下滑意味着当日损失 500 万营收。天然的单一突发事件几乎不可能造成这么大的损失,因此足以引起团队的重视(这里只是以融资计划书的付费数据为例,实际上作为运营负责人,这些数据都是内部可直接获取的)。
确定需要引起重视后,就需要寻求数据分析的角度,排查异常原因,我们以游戏行业为例,分析影响数据异常变动的原因可能有哪些,这里的思考模式其实就是金字塔结构思维模式:
先考虑全局指标:包括一定时间内新增用户量、总体付费率、总留存率、用户活跃度、各环节总转化率、搜索功能使用率、翻页率、崩溃率等。全局指标用于分析对全体用户产生影响的共性原因,绝大部分问题都会在全局指标上体现出来;
再看分渠道指标:可以按不同用户属性(新老用户)、用户来源(下载渠道)、用户自然属性(地域、性别)网络环境(网络运营商、网络接入方式)等维度观察不同渠道数据是否存在异常。
在上述两项指标基础上,再考虑用户行为数据:重点观测用户在不同时间段、不同需求类型下的行为,从而定位到由于某一细分人群的定向变化产生的数据异常;
时间因素:外界环境的影响也可能对产品数据造成影响,因此观测环比和同比数据都很重要。
典型如「月末效应」,即一定规模的用户群体因月底流量耗尽而减少上网行为,造成整体流量的下滑。另外,对于一款外卖产品而言。天气变化也会造成数据波动,通常阴雨天气的订单量会走高。
同样的,「周一效应」「寒暑假效应」也是游戏行业比较常见的效应,游戏 dau 在周一往往会走低,在寒暑假往往会走高;
其他产品线监控:百度集团旗下的其他产品线变动也可能成为造成订单量下滑的原因,例如 91 应用市场改变了 App 广告的展示位置,或是搜索引擎的算法调整降低了网民常用关键词的权重等(通过下载来源的分渠道数据可以明显看到哪个下载来源的数据有减少);
舆情监控:包括但不限于通过人工或机器方式,从内部反馈渠道如客服系统到论坛、贴吧、微博、朋友圈等处采集大众对产品的实时意见。极有可能因此发现导致产品数据骤然降低或飙升的特殊舆情,如竞争对手有了哪些动作、母公司运作重大纰漏等;
定位到具体的问题和原因后,给出对应的结论和解决方案,比如修复某个 bug,针对竞争对手的营销策略做出同等力度的折扣反击等。
分析出问题原因只是第一步,提出解决问题的方案才是最关键的。
看完上述内容是否对您有帮助呢?如果还想对相关知识有进一步的了解或阅读更多相关文章,请关注创新互联行业资讯频道,感谢您对创新互联的支持。