数据中台建设(2)--数据资产化
数据资产是数据中台的重要部分,将数据整理并形成有价值的资产数据才能更好的赋能业务。那么什么是数据资产?数据资产是能给企业带来经济利益的数据资源,它的典型特征是,有较好的组织形式,而非杂乱无规律的数据,数据资产能够实现看、选、用、治、评的闭环,也就是说数据资产可以通过数据的查询,选取,使用,治理和评估来形成数据从业务到使用的完整闭环。数据资产的载体是标签。
那么,如何定义具体意义上的数据和标签
从数据角度:包括业务生产过程中的所有数据,如交易信息、用户基本信息、沟通信息、用户浏览信息,这些数据都是使用具体业务过程中形成的信息,称之为业务数据。而从从标签角度来看,更关注的是数据反映出的某些特征化表现,比如个体的兴趣爱好、基本信息、社交网络、行为习惯。
如何构建数据资产,让自己的数据真正变得“有效?
1、资产构建步是正确的数据观
在前文,我们提到一个很重要的命题--业务数据化,数据业务化,怎么理解。就是说从业务(或业务人员)角度,出发点是考虑如何将业务通过数据形式展现出来,比如支付业务,如何定性和定量细化,可通过业务订单数据、支付成交数据等。数据业务化,是在处理数据和应用数据时应该落脚点在业务上,比如通过支付数据和订单数据的分析处理,需考虑的是如何将这些数据更好的与业务结合起来,可通过支付和订单量分析出热销排行,落脚在某些促销、营销和业务运营活动上。如此,双向互动从而将数据资产盘活,为业务赋能,并有效积累数据。数据资产是以价值为依据,以场景化为驱动,哪些能够解决场景需求,带来业务价值,它就可以成为数据资产。
2、前期调研(业务、数据)
数据资产的建设,必须在前期调研上下功夫,明确目标和使用客户是谁、业务痛点是什么、数据有什么。弄清需求才好对症下药,这是作为产品调研的基本要求。
3、标签及类目体系设计构建
第三步,我们回到资产这一关键词上。称为资产,那么必定是有一个内在体系支撑。这里就指的是标签和类目体系。通过调研业务痛点,我们知道客户的业务诉求在哪里;调研梳理客户数据,我们知道客户的数据有什么;根据业务诉求、可用数据来设计标签,标签是业务的抽象和治理。后,我们要做的是梳理标签类目体系。
如何构建数据资产,采用哪些方法来构建?
1、资产化方法论--识别三类对象(根目录)
这三种对象是指:人、物、关系,人与人之间、人与物之间、物与物之间,通过关系(Mapping)建立起联系,这三种对象是构建资产的基本要素。将公司、业务中所包含的所有对象用数据表达识别,将之归类到三种对象池中。
人(根目录),消费者/员工
物(根目录),交换机、笔记本
关系(根目录),购买、浏览、收藏、订单...
2、资产化方法论--构建数据类目体系
当完成对一切事物的数据抽象后,会发现数据种类非常多:对象很多、属性值也很多、需要采用一套数据类目体系方法,来体系化的对对象、属性、属性值进行归整摆放,合理管理有效使用。
数据类目体系,建设方式:
-按“流程”组织的数据:各业务流程记录
-按“物”组织的数据:统一汇总记录
-按“人”组织的数据:统一汇总记录
数据类目体系反应了构建者对企业原生数据的理解,是稳定的,不应经常发生变化。
比如:服装企业数据类目体系
加盟商(人)、员工(人)、消费者(人)
门店(物)、商品(物)、仓库(物)
交易(流程)、库存(流程)、要货(流程)
3、资产化方法论--设计标签
标签指能够被业务直接使用产生价值的数据,一般都需要结构化到字段粒度,保障数据服务使用。
标签类目体系面向数据应用端,解答数据怎么用
注意区分,标签和标签值,很多时候说的打标签其实是打标签值
标签设计包含:属性、指标、参数、特征
4、资产化方法论--设计标签类目体系
当某类对象下的标签越来越多的时候,就迫切需要通过类目体系的方法来组织、管理和规划标签。
类目体系:本身指的是将某一类item的分类、架构组织方法:将item分入合适的叶子类目中,具体item都是叶子节点。类目体系的本质是为了系统化的规划、管理和使用。
根目录--一级类目--二级类目--三级类目
数据资产与传统数仓的区别
数据资产特征:
- 能确权
- 可阅读
- 易理解
- 易使用
- 可计量
- 有定价
- 可管控
- 可增值
标签三种计算逻辑:
1)原始数据标签
2)统计数据标签
3)算法数据标签
标签类目体系关注的是对企业全局数据的整体梳理,数仓偏重领域建模
主数据的梳理也是被动式的,不适用于场景化
与传统数仓基于领域建模不同,标签类目体系是基于对象建模,描述的是对象的本质
互相融合影响,数仓可以用来构建原始类、统计类标签的开发过程
在具体的标签体系设计过程中,人的标签、物的标签要分开设计。设计时也要尽量充分、可复用。在使用的时候考虑清楚客户要的是什么,根据客户的具体需求来进行场景化的构建和使用这些标签设计。
相关文章