带你一起窥探企业数据中台的秘密 什么是数据中台

2020-07-09 00:00:00 数据 多个 企业 业务 能力

前言

近,发现朋友圈、微信群都在讨论着同一个话题“数据中台”,讨论的内容有以下几个方面:

1、数据中台是什么呢,公司要不要做,公司适不适合做,具体要怎么做,需要什么资源支持?

2、数据中台建设的价值和意义在哪里?

3、数据仓库、数据平台、数据中台之间又有什么区别和联系?

就目前为止,外界已经有很多前辈和朋友对于数据中台的概念、落地、教训等做了很详细的解读和分享。有些观点很赞同,有些观点描述的不是很恰当。当然,这个还是得仁者见仁,智者见智啦。

刚好目前本人所在的团队就是数据中台Team,算是有些实际的落地经验,无论是从产品或者从工程的角度,都有些看法、感悟以及体会。下面,我会和大家一起从以下几个方面,一起来窥探下企业数据中台背后隐藏的秘密。

【数据中台】

01、什么是数据中台

在询问“什么是数据中台”之前,先来回答一下“要不要做”,毕竟建“数据中台”对于企业来说是战略级需求。所以,下面我们先来一起更加透彻地理解“数据中台”这个概念,只有彻底理解了事物的本质,才能轻松做出“适不适合”的判断,毕竟先要知根知底,才能“对症下药”。

到底什么是数据中台 ?按照网络上的定义有以下几种:

  • 数据中台是数据服务(Data API)工厂;
  • 数据中台是一个能够满足业务创新的一个中间层;
  • 数据中台是指通过数据技术,对海量数据进行采集、计算、存储、加工,同时统一标准和口径

以上定义描述都不是太恰当,也不是很容易被人理解。

下面让我们来换一个角度回答以下三个问题,从而重新定义什么是数据中台:

1、它能做什么;

2、它需要什么;

3、它怎么做。

在现在的大数据时代,越来越多的企业开始重视并着手探索着数据的价值,希望通过数据运营的方式赋能业务,让数据成为企业业务增长的新能源。但是在真正落地去做数据运营、数据决策的过程当中,企业普遍都会遇到“独 - 数据烟囱式林立”、 “断 - 数据理解、认知以及分析断层”、“缺 - 缺数据、缺标准、缺治理”、“难 - 知数据难、懂数据难、要数据难”四大难题。

1、独 - 数据烟囱林立:每个部门都有建立了自己烟囱式的IT系统或者建立烟囱式独立的数据分析平台和数据仓库,这样就会导致数据共享非常的难,即有数据的重复、数据平台的重复开发,同时也带来数据重复的存储,造成企业资源和成本的浪费;

2、断 - 数据理解、认知以及分析断层:数据生产者和数据消费者对于数据的理解和数据价值在认知上没有得到统一,造成理解和认知上的断层;

3、缺 - 缺数据、缺标准、缺治理:企业各个业务线没有统一的数据治理的标准、没有存储好数据,甚至没有数据,根本就不知道从哪里获取数据;

4、难 - 知数据难、懂数据难、要数据难:企业业务部门与部门之间的数据没有统一规范,要理解彼此的数据难,做互连互通就更加难。

而数据中台的产生就是为了解决以上四大题。

首先,通过整合汇集企业原有烟囱式IT系统的多个业务线和散落在多个平台的数据,让所有的数据都融合到大数据平台,建立统一的数据采集能力,同时整合大数据处理、计算、存储以及数据服务能力,通过这样的方式,来降低大数据的开发成本和使用成本;

其次,集合各个领域的数据,运用新的模式、新的创新方法,让数据产生更大价值;

后,实现"大中台、小前台"的愿景,做到前台变成一个真正敏捷的作战单元。

个问题,数据中台能做什么呢。它能解决企业数据统一采集、数据统一存储、数据相互联通以及数据统一使用的能力,让一切业务数据化,一切数据业务化。

第二个问题,它需要什么。需要干净、透明、智慧的数据;需要一套标准的数据体系;需要一套完整的技术支撑能力。

第三个问题,它怎么做。首先先要以业务数据化为前提,数据标准入湖为基础,建立数据资产统一管理中心,然后才能发展成高效承载数据中台建设的数据运营平台能力中心。

总结一下,数据中台是全域级、可复用的数据资产中心与数据能力中心,可以提供干净、透明、智慧的数据资产与高效、易用的数据能力,使得业务能够数字化运营。

解释如下:

1、全域级:数据中台需要从顶层的行业领域到企业的垂直领域的数据,同时需要覆盖多个领域的数据,只有覆盖了多个领域的数据汇集,才能更好的进行数据统计/分析/挖掘,发挥出数据的价值;

2、可复用:数据的能力、数据平台的能力、产品能力都要具备可复用性,同时也可以快速敏捷为多个前台业务部门提供技术支持;

3、数据能力中心:具有为业务做数据运营平台的能力;

4、数据资产中心:不是像之前的数据仓库一样汇集在一起就是数据资产中心。还要保证数据是干净的、透明的、智慧的。

  • 要保证数据是干净的、质量是高的、可信的,并且是没有脏数据的;
  • 在有安全、隐私、授权、加密等数据权限机制下,可以安全的共享给其他业务线的数据;
  • 需要的不是死数据,要活数据,要是能和业务部门业务场景相互结合的数 据,要具备能够为业务沉淀,给出业务关联的算法、数据模型

相关文章