自己从事数据工作多年,干过大多的数据岗位,成为管理者后,也带过很多的人,关于各类数据岗位人才的关键素质,自己也形成了一套看法。正如智商是多基因作用的结果一样,要成为某类数据岗位的人才,肯定也是多因素决定的结果。但每类数据岗位还是有其特定要求,而能适配这些特点的人更能在这些岗位脱颖而出,我这里就结合自己的实践,谈谈每类岗位关键的素质。数据分析师关键的素质,是要有“下立地,上顶天”的气质。“下立地“就是要接地气,要有足够的取数实践,具备较强的业务和数据敏感性。很多合作伙伴的大牛深谙数据分析的讨论,方法论牛逼,PPT写得很好,但一般实操还是不行,主要的制约因素就是数据能力,数据分析工作一般不会外包,主要在于外包人员很难长期的“接地气”。数据理解能力不是说你知道有这个表和这个字段就可以了,不是看看数据字典就可以了,而是要能知其所以然,要能追根溯源数据是怎么来的,要能知道这个数据是否真实的反映了业务的实际状况。同样一个业务口径,往往可以采取多种数据口径,而要辨析清楚这个差别,选择到适合的,一定要有足够的取数实践。“上顶天”就是胆子要大,脸皮要厚,能说会写,敢于跟上级去沟通互动。“下立地”在迫使你成为一个内向的人,“上顶天”则迫使你成为一个外向的人,数据分析师一定是能够达到很好平衡的人。在跟上级的互动中,数据分析师会始终处于学习期,不断接受上级的指示,然后消化吸收,然后反馈,然后再接受指示,如此迭代......,这才是数据分析师真正的成长之路。所有的数据分析技巧和方法论,都可以在跟上级的互动中学到,这些才是真功夫,不用刻意去学习什么金字塔理论,老板的言传身教就是好的方法论。这种能达到“下立地,上顶天”的数据分析师,后大多突破了数据分析师这个岗位本身,成为一名的管理者,我数了下自己欣赏的很多数据分析师,后来大多成为了主管,即使是到了其他部门也是晋升迅速。数据分析其实是数字化时代每个人都要具备的能力,拥有数据分析的技能不仅是为了满足领导的决策需要,更要能直接指导生产。我总是建议数据分析师有机会一定要到各个实际业务岗位磨练一下,因为现实世界并不是靠系统上存储的那些数据所能完全反映的,如果你始终囿于一只数据团队内部,只喜欢跟数据打交道,那只能做一颗螺丝钉。数据挖掘师关键的素质,不是模型能力,而是要有产品思维。企业中真正有价值的数据挖掘师往往不是技术强的那个。自己曾经管理过很多的数据挖掘工程师,每当需要评定每个数据挖掘师的业绩时,技术能力强的常常排在后面,而评价高的往往是有想法,愿配合的那个人,那个人甚至不会R或Python,只会点EXCEL的技能。当前大多企业的数字化水平一般,数据挖掘工程师面临的环境并不友好,大多企业数据挖掘师面临的大挑战,其实是要能够找到数据模型在企业生产流程的真正应用场景,规模化这些场景,创造出真正的价值。现实中的数据挖掘师一定是能理解业务,熟悉流程,懂得系统,会做分析,还会运营,不要只会对着电脑猛干,围绕着AUC,ROC,F1这些指标闭门造车。数据挖掘师要能把模型当成一个产品去运营,具备产品的思维和方法,能设定目标并找出实现的道路,能正确的识别问题、并找出合适的解决方案(不仅限于技术方案),带领团队把大问题化解为小问题,终完成项目。也就是说,其能在整个产品的生命周期从头到尾将一个模型产品负责到底,在笔者做成功的几个数据挖掘项目中,无一例外遵循了以上的原则,凡是不遵循的,全部失败了。数仓模型的好坏直接决定了应用的效能,其也是数据中台的核心内容,但对于数仓模型工程师的挑战也特别大,这是由数仓模型的生态位决定的。数仓模型夹在基础数据和上层应用之间,承上启下的价值巨大,但也是容易被忽略和替代的。因为上层应用完全可以绕过数仓模型,直接基于基础数据完成应用模型的建设,虽然应用要花点代价做自己的个性模型,但架不住快和灵活啊,对于单个应用来讲,其没有驱动力去配合数仓模型工程师完成中台模型的构建,即使这种行为从长期来讲损害企业利益。正是由于这个背景,数仓模型工程师前期没啥成就感,很难被理解,做的工作非常枯燥。一要对企业的数据资产要有全局的理解,这个不下苦功夫不行。二要对垃圾的原始数据做清洗,这个没点执着的精神不行。三要基于对业务和数据的充分理解进行领域、概念、逻辑和物理建模,并且要在没有业务推动的情况下去沉淀优化。四是要厚着脸皮去推销自己的成果,可能还要建章立制。后,技术也没啥好研究的,维度和关系建模都是几十年前的东东了。数仓模型是在做长远的正确的事情,没有足够的耐心很容易放弃。笔者带过的很多数仓模型师,要么去做报表取数了,要么去做应用去了,即使做维护也好啊。数据仓库领域的怪现象就是,数仓项目一旦完成,数仓模型就基本停滞发展了,5年都没有什么改变,因为人都跑完了。但数仓模型一旦做好了,价值也非常大,因为底层模型做好了,其效能可以辐射到所有的应用,否则就不会有数据中台了。这让我想起孔子对得意门生颜回的评价:“吾与回言终日,不违,如愚。退儿省其私,亦足以发,回也不愚。” 孔子的意思是:“我和颜回谈论一整天,他从不提反对意贝和疑问,就像一个愚笨的人。可是,我注意观察他课后的情况、却发现他很能发挥我所讲的内容,颜回并不愚笨啊。“数仓模型工程师无需显山露水,更不能卖弄聪明走捷径,好的模型都是自己一步一个脚印运营出来的,但正是这些模型构成了数据中台真正的底蕴,所谓大智若愚。数据产品经理关键的素质,是要对于数据有深刻的理解。数据产品经理是产品经理的一个子集,但到底是与数据相关的素质重要,还是与产品经理相关的素质重要呢?个是有关数据产品主要内涵的,我觉得客户对于数据产品有两大诉求,一种是以信息展示为主,解决信息快速获取的问题,比如报表和指标,另一种是以信息加工为主,解决精准度的问题,比如洞察、营销或风控,而以流程为核心的大多数产品,即使有一些数据的内容,也不属于数据产品的范畴。第二个是有关数据产品核心能力的,在我们运营的所有数据产品中,虽然前期客户会关注这些数据产品的交互、功能和体验,但如果客户是来真的,终还是会聚焦到数据上来,客户对我们大的诉求,终都是数据质量问题或者是模型准确度问题,其他所有的问题,都是可以解决的。数据产品经理如果不理解数据,解决上述问题的效率还是很低的。当前垂直行业是数据产品大的蓝海市场,但要切入垂直行业,数据产品经理除了要去理解这个行业的业务,更要能思考自己的数据和模型能为这些行业提供什么样的差异化价值,这才是数据产品成功的关键。虽然数据产品从名称看,似乎是产品的一个子集,但从客户的诉求看,两者则是完全不一样的东西,纯数据产品跟功能型产品的差异,就好比OLTP跟OLAP系统的差异一样,有天壤之别。OLAP已经成为了一种范式,数据产品也一样,其核心就是数据,而不是流程或者其它。很多企业是没有取数工程师这个岗位的,记得我刚进单位的时候,干的是SQL取数的工作,但岗位名字却叫作开发工程师,很多企业把取数工程师纳入了数据分析师的范畴,这个不太合适,还有的叫作BI工程师,也是怪怪的,考虑到干取数工作的同学基数实在很大,因此我还是要说说这个岗位需要的关键素质。取数工程师关键的素质,我认为是“开天辟地”,“开天”是主动性训练,“辟地”就是寻求多样性。我带过的大多数下属都经历过取数工程师这个阶段,取数虽然技术天花板不高,但通过取数可以让你迅速理解公司的业务和数据,这是后续从事数据相关工作的一个基础。但成也取数,败也取数,通过简单的被动取数实践能提升的业务和数据的能力是有限的,一般在6个月-2年内迅速达到天花板,再进一步就非常困难了,很多取数人员掌握的技术只是简单的SQL一项。“开天”是指取数工程师应该采取更为主动的姿态去学习取数。一是要能主动请缨,尽可能的拓展业务支撑的范围,这样可以让自己拥有更广的业务和数据视野,千万不要坐井观天。二是要能主动溯源,即能通过血缘分析等手段知道任意数据的来龙去脉,因为取数接触的表大都是被“阉割”过的模型,这些模型在提升便利性的同时,也过滤掉了大量的有价值信息,理解了数据的底层可以让你的取数能力超越大多数人。三是要能主动思考,即尽可能去理解业务人员取数的业务背景及业务人员的分析思路,然后给出更好的取数方法,业务人员对有想法的取数人员会肃然起敬。“辟地”是指取数工程师始终要探索其他岗位的可能性,因为取数工程师其实是数据从业者的一个中间状态,其离真正的技术有点远,离真正的业务也有点远,你不可能靠取数去直接实现数据驱动业务的理想。当你具备一定的数据基础后,一定要寻求从事更贴近业务和技术的数据岗位,无论是数据分析师、数据挖掘师、数据产品经理或者数据开发工程师等等,“开天”之后的取数工程师,一定会获得这种机会,我没有见过不成功的,只见过不努力的。就先讲这五个岗位,其他的岗位有机会再谈,这其实也是见仁见智的事情。