当前,各行各业广泛开展了数据湖、数据中台以及大数据中心等建设项目,通过这些项目能够实现降本增效以及监管合规等业务价值。
不过,在这一过程中,企业也面临过去二三十年间存量信息系统和存量数据资产等庞大的数据源,这些数据普遍存在着不可理解、不规范、不一致和不准确等问题,制约了数据价值的发挥。数据治理为这些问题提供了凯发k8官网下载的解决方案,数据治理作为一项基础工作获得越来越多企业重视,成为企业的普遍实践。
从企业对数据服务的需求看,过去二三十年,中国数据行业经历了从点到面,从应用到底层治理的历程:从最初注重数据生成,到数据分析,再到以中台化为特征的平台化融通,目前数据应用已高度繁荣。
数据应用繁荣发展的同时,也让企业看到包括数据质量等数据底层的问题,亟需通过数据治理解决,中国的数据治理行业起飞的时机已经到来。
与此同时,从国外的经验看,过去两三年来,数据治理和数据管理领域的融资并购明显加速。2019年4月,总部位于美国加州的数据管理平台segment 宣布获得1.75亿美元融资,融资后估值为15亿美元;2020年1月,总部位于加州的专注于数据安全治理领域的厂商securiti.ai 宣布获得5亿美元融资。
数据治理的具体内容包罗万象,同时,涉及的厂商纷繁复杂,包括传统it集成商、咨询公司和数据中台厂商等。数据治理市场该如何界定?是否会发展成一个独立市场?未来的市场空间如何?基于行业研究,以及对行业代表企业的深入访谈,爱分析将通过本文对这些问题作出详细解答。
01 数据治理伴随数据平台建设和运营过程展开
在目前各行业数字化转型的大背景下,数据治理工作是伴随着数据平台的建设以及运营过程而展开的。如下图所示,在企业展开的大数据平台建设和应用开发项目中,具体内容一般包括咨询规划和具体建设两个部分。
其中,咨询规划环节包括三个方面:第一是数据平台本身的规划,包括数据库架构、数据模型、技术组件和数据加工逻辑等规划工作;第二是上层应用规划,如精准营销和智能风控等智能化应用的规划工作;第三是数据治理规划。
由此可见,数据治理工作属于数据平台建设和运营中的一个环节,数据治理落地既需要企业自己运营,同时需要融入其他工作的过程中。具体来看,数据治理的落地工作包括两个方面:数据治理的管理落地以及数据治理的技术落地。
数据治理的管理落地,包括组织、制度、标准和规则等内容,会融入到数据平台与上层应用的建设与运维过程中,对后者进行指导和约束;而数据治理的技术落地,则会有一套数据治理平台,如数据质量管理平台和数据标准管理平台等,支撑数据治理的管理落地和常态运营。
另一方面,在面向组织全域数据环境时,数据治理工作则不限于数据平台建设和运营过程,还包括面向源端业务系统、生产系统以及对外数据合作相关的数据平台。
数据治理是指企业为实现数据资产价值最大化所开展的一系列持续工作过程,目标是明确数据相关方的责权、协调数据相关方达成数据利益的一致以及促进数据相关方采取联合数据行动。具体来看,数据治理包括数据质量管理、元数据管理、数据标准管理、主数据管理、数据架构管理和数据安全管理,同时还包括数据管理相关的组织与制度。
作为“舶来品”,数据治理概念在中国经历了与本地文化落地融合的过程。根据dama 国际数据管理协会的定义,在国外,数据治理一般仅包括目标、原则、组织、制度、流程等软性要求,属于数据治理的“狭义”范畴。而在中国,则将数据架构、数据标准、数据质量和数据安全等一系列数据管理活动纳入数据治理的范畴,属于“广义”层面的数据治理。
02 数字化转型加快,数据治理建设迈入第四阶段
数据治理在中国已经历了早期的数仓建设以及监管政策驱动的第一和第二阶段,还经历了近年来大数据平台以及数据中台等建设项目驱动的第三阶段。在数字化转型战略的推动下,中国的数据治理正进入决策层牵头建设的第四阶段。
1)第一阶段:2005-2009年
2005年左右,早期的数据仓库建设在中国兴起,一开始主要由商业银行、通信运营商主导,随后能源等行业企业加入。商业银行通过与埃森哲、ibm等国外it咨询公司合作,最早将数据治理的概念在中国予以实践。
数据仓库建设涉及从不同来源的平台中抽取数据并进行整合,在这一过程中,需要确保数据质量,包括数据口径、数据标准和数据模型统一等。通过数据治理,建立起数据标准、数据模型等管理体系,能够提升数据质量,确保数据仓库建设顺利推进,进而能够更好支撑起bi等数据分析型应用。
这一阶段,不同行业开展数据治理工作的路径并不相同。由于监管要求和对于管理咨询理念接受度较高,商业银行的数据治理工作一般是在数据仓库建设之前或者建设过程中展开;而通信和能源行业企业则更加重视数据仓库平台本身建设,数据治理是在平台建设之后展开, 如中国移动的数据仓库建设始于2004年,而元数据管理规范则于2006年才正式推出。
这一阶段的数据治理一般由it部门和信息化部门牵头,it人员承担数据治理的主要职责,业务部门很少参与。
2)第二阶段:2010-2014年
这一阶段的数据治理的需求主要集中于银行业,主要由监管政策驱动。巴塞尔委员会于2010年底发布《第三版巴塞尔协议》,从技术层面对于银行在数据的使用、积累和管理等方面提出了要求。
为了推动中国银行参与到国际清算体系中,银监会开始在国内推广《巴塞尔协议》。早在2009年,银监会就针对数据标准和数据治理这一话题进行了行业性研究,随后于2011年推出《银行监管统计数据质量管理良好标准》。该标准从组织机构及人员,制度建设,系统保障和数据标准,数据质量的监控、检查与评价以及数据的报送、应用和存储五大方面对银行数据治理提出要求。
随着银监会出台相关的数据治理监管政策,银行业对数据治理演化成全行业的需求。不过,这一阶段的数据治理仍主要由it部门牵头,业务部门参与有限。
3)第三阶段:2015-2018年
随着企业业务在线化以及“互联网 ”等战略的深化,企业内部产生了海量的数据,并产生了充分利用数据并挖掘数据价值的需求。在这一背景下,2015年左右,企业兴起了大数据平台建设。
不过,囿于企业内部项目推进以及数据结构复杂等多种因素,大部分企业所展开的数据湖等大数据平台建设项目一开始效果不尽人意,其中一个重要原因是数据管理方面存在问题。这引起了行业性的反思,企业希望通过加强数据治理,提升大数据平台建设的效果。
进入2018年,数据中台概念流行,企业纷纷推出数据中台项目。作为一种组织架构,数据中台概念所包含的统一数据资产管理、统一元数据管理等内容与数据治理的理念不谋而合。随着数据中台项目的推进,数据作为一种资产的理念开始被企业广泛接受,推动了数据治理的进一步发展。
在这一阶段,越来越多的企业开始搭建数据治理的专职团队以及数据治理相关部门,数据治理不再仅是it部门的工作,业务部门开始参与进来。在此过程中,数据治理的实践仍存在一个误区——只在数据中台内部开展数据治理,而对源端业务系统的数据治理关注不足、推动不利,这也造成数据中台的局部治理并不能保证企业持续不断得到高质量数据。
4)第四阶段:2019年-至今
在大数据平台和数据中台持续建设的同时,2019年以来,企业数字化转型进入快车道。数字化转型强调从企业全局出发进行战略统筹,一般由企业最高管理层直接负责推动,数据治理真正第一次进入到了企业决策者的视野。
在这一阶段,数据治理已内化成为企业机制建设的一部分,如2020年9月,国资委发布的《关于加快推进国有企业数字化转型工作的通知》,针对央企数字化转型工作,明确提出构建数据治理体系的要求。
在包括金融、通信、能源等数据治理开展相对成熟的行业,大多数企业都已设置数据治理(数据资产管理)的专职部门和岗位,而且越是数据治理成熟的企业,专职部门越是靠近业务侧,且专职部门级别越高。
从以上数据治理历经的四个阶段可以看出,数据治理工作是随着数据应用的深化而逐步推进的。总体来看,当前大部分企业已经认识到数据治理的重要性,并已普遍开展了数据治理工作。根据御数坊于2021年初发布的《企业数据治理现状调查报告》,在参与调查的近600家企业中, 88%表示已展开了数据治理工作。
03 中国数据治理市场迎来爆发,未来前景可期
随着企业越来越多开展数据治理工作,企业对数据治理相关的产品和服务投入也逐步增加。
在当前阶段,中国企业的数据治理工作主要是围绕着大数据平台的建设和完善过程而展开的。随着中国企业大数据平台建设步伐的加快,与之相关的数据治理市场也将迎来爆发增长。
idc预计,到2023年,中国大数据市场总规模将达到1600亿人民币,其中软件和服务约为1000亿元。2019年至2023年,中国大数据市场的复合增长率为23.5%。根据爱分析的调研,在包括银行、能源和通信等企业典型的大数据平台建设项目中,约20%预算用于数据治理工作。据此推算,到2023年,中国的数据治理市场规模将约为200亿元。
分行业看,早期对数据治理需求主要来源于金融和通信运营商,不过近年来,包括能源、房地产、汽车等行业借助数字化转型的浪潮,奋起直追。此外,随着数字政府和智慧城市等项目的推进,政府部门也成为了数据治理的重要需求来源。idc数据显示,2018年,中国数字政府大数据市场达47.44亿元人民币,其中数据管理和治理的软件和服务市场为31.81亿元人民币。
04 沉淀管理方法论,打造通用化产品是实现规模化的路径
目前市场上数据治理的玩家主要分为三类:第一是it咨询公司,典型的厂商包括埃森哲和ibm等;第二是数据平台和数据中台公司,包括明略科技、数澜科技和惟客数据;第三类则是专注于数据治理的厂商,典型代表是御数坊。
从产品和服务的供应来看,当前中国数据治理市场呈现较为分散的状态,这主要受限于当前数据治理厂商采纳的交付模式。
目前数据治理厂商典型的交付模式包括两种,第一种是传统咨询模式;第二种是数据治理软件为主的纯工具类交付模式。在这两种模式下,要实现数据治理的价值体现和规模化落地都面临巨大挑战。
在咨询服务模式下,it咨询公司以提供顶层设计规划以及组织制度规划等体系化的咨询服务为主,与具体业务场景存在较大脱节,企业业务部门参与度低,往往难以落地见效;在数据治理软件的交付模式下,技术工具公司更侧重数据开发人员技术化的功能,技术功能同质化严重,并且难以支撑业务人员、专职的数据治理人员使用,数据治理效果和价值难以发挥。
由此可见,在当前两种模式下,采纳任意一种都难以实现规模化落地,而要真正实现规模化其中一个路径是将两种模式进行结合:将管理方法论进行沉淀,打造成通用化产品,结合数据治理软件产品以及智能化等先进技术,从而解决数据治理难以上手以及价值无法发挥的难题。
而这种可以因地制宜,实现高价值的模式,对厂商的产品能力提出了更高的要求,具体来看,体现在以下两个方面:
第一是数据治理方法论和场景设计能力。咨询方法论是指针对数据管理全生命周期形成的体系性实践纲要,而场景设计能力则指针对数据应用场景的规划和落地能力。
数据治理方法论和场景设计能力越强,就越能够对数据治理过程中涉及的各种工作任务进行可操作的流程设计和软件应用开发,将数据资产盘点、数据标准管理、数据质量管理、元数据管理以及数据认责管理等流程以在线化的方式形成通用化产品,实现跨行业的规模化落地。
第二是技术能力。在数据治理落地和实施过程中,可使用 nlp、机器学习、知识图谱以及低代码等先进技术,提升数据标准制定、数据资产目录建设、数据认责管理等工作的效率,减少人工成本。厂商具备的技术能力越强,就越能够快速推进项目的落地,实现规模化部署。
05 咨询和产品一体化发展,御数坊推进数据治理规模化应用
御数坊是融合了咨询服务模式以及纯工具类交付模式的典型代表厂商。
御数坊成立于2014年,成立之初主要以提供咨询服务为主。近两年来,御数坊实现转型,目前形成了“咨询服务 软件产品”的咨询和产品一体化的服务模式,为企业提供全栈的数据治理凯发k8官网下载的解决方案。
御数坊(北京)科技有限公司成立于2014年12月,是一家在数据治理领域专注十年以上的专业机构。成立以来,参与多项数据治理专业国家标准编写,服务于多家大型企业,行业覆盖银行、证券、能源、地产、汽车、通信、制造、政府等领域。御数坊以“咨询服务 软件产品”的一体化交付模式,致力于解决中国客户多年以来的数据治理实践困惑和挑战。
御数坊(北京)科技有限公司成立于2014年12月,是一家在数据治理领域专注十年以上的专业机构。成立以来,参与多项数据治理专业国家标准编写,服务于多家大型企业,行业覆盖银行、证券、能源、地产、汽车、通信、制造、政府等领域。御数坊以“咨询服务 软件产品”的一体化交付模式,致力于解决中国客户多年以来的数据治理实践困惑和挑战。
在之前的咨询以及纯工具交付模式下,咨询服务与数据治理软件存在断层,服务和产品与客户需求脱节,数据治理投入大、时间长、阻力大而且价值低下。而御数坊采用的咨询和产品一体化的服务模式,可有效解决这些难题,既解决了咨询模式下数据治理难落地的问题,也解决了纯工具模式下软件工具面向技术人员而无法被业务人员使用的问题。
御数坊目前推出了拳头产品“dgoffice数据治理办公室”。dgoffice构建了大量基于咨询方法论的协同化应用场景,能够让客户简单、规范的实现数据治理工作的起步。基于dgoffice,包括业务人员在内企业人员可在线进行数据资产盘点、数据认责管理、数据标准管理和数据质量管理等工作。
由于御数坊实现了将治理方法论融入dgoffice产品中,构建了数据管理工具功能化向场景化的转化,因此能够实现在同行业以及行业间进行复制,推进规模化部署。与此同时,dgoffice还具备智能化以及低代码能力,能够快速的支撑起客户个性化的管理场景,提高实施与交付的速度。
在咨询方面,御数坊的服务模式从以往的重咨询转向了当前以面向业务场景的微咨询为主。在微咨询的模式下,御数坊会围绕着客户反馈的业务场景和数据问题,如营销指标治理以及客户数据治理等,提供咨询服务。相比面向全企业集团的大型体系化的咨询项目,面向场景的微咨询能够围绕具体痛点,快速解决客户问题,具备见效快和效率高的特点,通常情况下,两周到1个月就能完成。
在商业模式上,在目前轻量级微咨询的交付模式下,御数坊的收费模式也比此前重咨询的交付模式下变得更加灵活。具体来看, 御数坊目前的收入构成增加了产品部分的收入,按照模块进行收费;而咨询服务方面,则按照人/月进行收费。
未来,御数坊将继续坚持咨询和产品一体化的发展路径,同时提高产品在整体收入中的比例。具体规划体现在以下两个方面:
在技术方面,御数坊将加强对低代码、nlp、知识图谱和机器学习等智能化技术的投入,提升产品实施和部署的效率;与此同时,御数坊还将加大对云环境下数据治理应用的研发投入,以适应当前企业it基础设施云化以及多云的趋势。
在产品方面,在做好数据治理相关功能模块的同时,御数坊还将探索向包括数据安全治理以及数据交易合作等领域拓展。
06 面向未来,数据治理开启新征程
在市场规模迎来爆发增长的同时,未来中国数据治理市场也将呈现出新的特点,主要体现在企业需求、政策、技术以及基础设施四个方面。
在企业需求方面,在“数据民主化”趋势下,企业业务部门将越来越多参与到数据治理和数据利用的工作,数据治理将从it部门及数据团队走向业务部门,场景将变得更加丰富。
与此同时,随着“数据要素”概念的推行,面向数据交易和数据合作的数据治理,或将成为新的趋势。在完成大数据平台建设的基础上,对外进行数据合作,能够提升数据价值,而在这一过程中,通过数据治理能够明确数据开放和共享管理机制,保障合作各方利益。
在政策方面,数据治理的监管政策或将从银行业扩展至其他行业。过去两年,国家各个部委纷纷出台针对全行业的数字化转型、数据要素等方面的政策,数据治理成为这些政策的重要组成部分。
例如,国资委于2020年9月出台《关于加快推进国有企业数字化转型工作的通知》。通知提到国有企业集团应该加快数据治理体系建设,明确数据治理归口管理部门,加强数据标准化、元数据和主数据管理工作,定期评估数据治理能力成熟度。
在技术方面,随着数据安全及隐私保护相关法律法规的出台,数据治理中正在增加数据安全相关的要素;而随着ai、区块链等技术的逐渐成熟,以及企业已经通过前期数据治理工作积累了大量元数据信息,包括nlp、机器学习以及知识图谱等智能化技术有望在数据治理中得到广泛应用。
在基础设施方面,企业上云进程加快,同时企业越来越多的采用私有云、公有云和混合云等多种形式,并且使用超过一家云厂商的服务。多云的环境下也给数据管理工作带来了挑战, 数据治理需要适应这一趋势。
未来, 随着企业数字化转型的加快,对数据治理的需求将进一步提升;与此同时,国家和行业纷纷推出数据治理相关的行业政策以及行业标准,数据治理在中国将迎来属于自己的春天。