Data Analyst,我是如何用数据影响管理层决策的?

八月 27, 2019

我们生活在一个愈发便捷的网络世界里。

Amazon会根据你过往的消费记录,向你推荐类似产品。Youtube通过你以往的观看历史,为你推荐你可能喜欢的视频。Linkedin通过你的profile,帮助你找到匹配你技能的工作。

这样越来越精准化的产品投放,都要归功于data science的迅速发展。相应,各个行业对于data scientists和data analysts的需求也日渐提升。

Data science到底是干什么的?

伴随着网络的出现,人类现在拥有的数据规模越来越大,你曾浏览过的网页、点击过的链接、逛过的社交平台,甚至是你曾经去过的地方都会被记录下来。这些数据看起来琐碎,但是在企业进行商务决策时,这些数据却经常能起到至关重要的作用。

就以超市为例:

假如你在三周内一直在一家超市买一种减肥产品,那么这家超市就会预测你接下来还会继续买这款产品,于是他们就在你结账时为你提供一张买四送一的优惠券,而你因为得到了优惠更愿意来这里买东西,超市也因此得到了一个更加忠诚的客户。

这种通过数据分析来预测未来的方式就叫做predictive analytics。

再比如说,通过对你购买的减肥产品的分析,超市发现你买的产品都具有某种特点,比如low carbs、low sodium,那么超市就会自动给你推荐具有相同特点的其他产品。这样做就会帮你省去找寻、挑选产品的麻烦,让你有了更好的购物体验,超市也因此可以卖出更多的东西。

这就是descriptive analytics,通过数据分析找出过去时间的特征并判断当下事件的趋势。

还有一种分析叫做prescriptive analytics,它是指分析数据来找出最优方案。

比如在情人节的时候,超市认为鲜花的需求会很大,所以当天直接涨价20%,第二天再降回原价。即使你发现涨价了,也不得不买,这也就让超市的利润最大化了。

通过对数据的分析利用,商家可以获得更高的利润,更多的用户,以及更高的用户忠诚度。企业对于data science方面的人才的需求自然也越来越大了。

Data analysts要做什么?

通常data science的entry level的职位都是data analyst。经过几年之后,可能会升职成为data scientists。比起data scientists,data analyst接触的建模工作可能会少一点。

data analyst的职能大致可以分为三个部分。

 Predictive Modeling :通过收集和清理数据,建立模型,优化模型,根据最后得出的结果给出解决方案。

 Product Analytics 根据数据分析,找到insights,并将你的发现向产品经理或者工程师展现出来,通过实验验证这些发现的因果关系,从而使产品得以优化。

最常见的分析方法便是Funnel analysis。比如说你的产品的网页一开始有100%的用户,经过每一次点击按钮之后都会失去5%的用户,但在某一步点击之后突然失去了30%的用户,这就说明这一步是存在问题的了。这是你就要找出这一步的问题所在,提出改善方法,提高用户的留存率。

 Reporting 清理数据后,将数据可视化,并用dashboard展示出来,让团队里的同事和公司的管理层及时了解到目前的经营状况。

Data analysts要会什么?

 SQL 

SQL是data analyst的必备技能,也是面试中必考的一项能力。在学校学习的SQL语句都比较简单,但是实际的面试会出一些比较难的问题。

Case when, Group by, Having, Self join, Left outer join, On vs Where等语句要着重掌握,这些都是面试中经常会考察的。

Case when会经常用到,有时候会嵌套很多层。当你遇到一些没有思路的题时,不妨试试self join。

 R/Python 

很多人都会纠结到底要先学哪一种语言?是不是会其中一种就可以了?

其实,最好还是要两种都会。因为一般情况下,公司里都是一半使用R,一半用Python。如果你只会一种,那你和另外一半的同事就很难合作沟通了。

虽然面试的时候,面试官只会让你根据喜好选择使用一种语言,但是技多不压身,两种都会自然是最好的啦。

数据分析常用的package一定要熟悉,R的话有Ggplot2和Dplyr,Python的Package有 Pandas, Scikit-learn, Matplotlib。熟练运用这些package会让你在面试中大大加分的。

 Machine Learning 

最常用的模型就是Linear Regression和Logistic Regression,它们的数学逻辑都需要掌握,至于像Random Forest这些模型,用的并不多。

 A/B testing 

在实际的工作中,A/B testing会被大量用到。学校学习涉及到A/B testing的内容比较少,想要从事data analysts的同学们需要课下多补充一下这方面的内容,可以多读读有相关工作经验的人写的博客。

 Experiment Design 

Data analyst有时需要和产品经理一起设计实验,研究改善产品特性的哪一方面才能得到优化结果。有时候遇到难度较大的实验设计,就要依靠自己的个人经验了。

 Product Sense 

这一点是需要工作经验来积累的,作为应届生,可以通过实习或阅读前人的文章来积累一些经验。比如说关注一下某个产品最重要的指标是什么,以及为什么。

 Business Sense 

在学校做项目的时候,学生得到的数据一般都很完美,还会有老师制定的框架。但是现实的工作中,原始数据会出现很多问题,可能会让你无从下手。这时你自身的商业敏感度可能会帮你理清一些头绪。

 Communication 

作为data analyst,沟通能力也是必不可少的,你需要把你的发现和想法准确地传达给你的听众,以提高团队工作的效率。根据听众类型的不同,你表达的侧重点也要不同。

比如说,你的听众都是data analyst或者data scientist,那么你可以多讲一些项目的细节。如果你的听众是公司高层,他们没有过多的专业知识,比起细节更看重结果,那你就要用浅显的话语来说明你的发现。

Data analyst的面试对口语要求很高,并且要求你的表达要做到逻辑清晰。通过演讲和presentation,可以很好地锻炼这方面的技能。

Data analyst的面试形式?

一些公司在面试之前会先给你一个online assignment,让你在一到三天内完成。通过之后就会有电话面试,了解你之前的经历,做过的项目。电面也有可能会考SQL,但不会考实际操作,只是问问遇到某个问题你会如何处理。

之后就是on site面试了,一般有4-6轮。面试的内容会很杂,可能会考概率、product matrics,有的公司也会考机器学习、算法。至于编程能力,只需要掌握Leetcode里Easy和Medium难度的题就可以了。

其中还会有2、3轮是case interview,来考察你的逻辑、表达和商业敏锐度。有些公司还会有一轮产品经理面试,来测试你可不可以和产品经理愉快合作。

如果你想要通过data analyst的面试,就要全方位地去准备,除了加强专业技术,还要去学习提高Product Sense和Business Sense。

平时可以多读读Techcrunch上的科技新闻,多一些积累,这样有助于你在面试中表达出更深刻独到的见解。

想要获取相关岗位信息和咨询相关实习项目请添加小锥微信哦~关注我们的公众号《海外实习与就业》,获取更多一线干货!