数据作为数字经济发展的核心资源,是驱动社会创新、经济高质量发展的源动能。随着“数据二十条”的发布和国家数据局的正式挂牌成立,我国数据要素市场培育进展加速,数据要素统筹管理、协同发展的体制机制正在进一步完善。
为推进数据管理行业迈上新的台阶,2023年12月20日,“2023数据资产管理大会”举办,中国信通院云计算与大数据研究所所长何宝宏分享了数据治理发展的六大趋势。
趋势1:dataops打造数据开发治理融合新范式
数据开发能力是企业数据生产力的核心,大型银行和运营商已经构建了较为强大的数据治理体系,但仍然存在数据需求不畅通、开发治理两张皮、数据开发效率低、跨域协同难推进等问题。
dataops(数据开发运营一体化)是数据开发的新范式,将敏捷、精益等理念融入数据开发过程,通过对数据相关人员、工具和流程的重新组织,打破协作壁垒,构建集开发、治理、运营于一体的自动化数据流水线,不断提高数据产品交付效率与质量。
何宝宏透露,为指导企业开展dataops工作,中国信通院牵头定义了dataops能力框架,将dataops的流水线分为研发、交付、运维和价值共四个域。dataops体系的运转还需要组织管理、系统工具和安全管控三个关键的保障职能。由信通院牵头的标准组织正在完善dataops标准体系,2022年底标准组完成了数据研发管理的标准,并在农业银行、工商银行、浙江移动、江苏移动等进行了评估验证;今年发布了《dataops实践指南1.0》,已经完成了系统工具的标准化工作,将启动交付、运维两个标准的制定;2024年将进一步完善标准体系,持续推动dataops理念在国内落地。
趋势2:数据编织重塑下一代数据架构
大型机构正面临数据统一纳管的难题。大型机构分支机构多、业务体系庞杂、数据平台建设缺乏统一规划,导致无法在集团层面形成统一的数据管理与应用视图,集团内数据共享和流通成本较高,难以整体激活数据价值。有部分大型机构尝试通过统一物理基础设施来解决这一问题,但依赖于高层强有力的推动,且成本和代价较大。
数据编织(datafabric)是一种新崛起的数据管理设计概念,目的是实现一种灵活的、可重用的和增强的数据集成方法和服务,从而能够跨多平台支持不同的数据操作和分析任务。其核心思路是通过增强数据目录、数据虚拟化、主动元数据等技术,将大型机构内多个数据平台进行逻辑集中管理,避免物理集中带来的重复建设,实现数据在大型机构内的统一纳管、充分共享、融合分析与应用。
据悉,国内外已经有企业开始提供数据编织凯发k8官网下载的解决方案,信通院牵头的标准组织已经启动相关研究和标准化工作,明年将发布相关的研究成果。
趋势3:数据资产运营加速企业数据价值释放
数据资产管理试图建立一种新的理念,即面向数据价值开展数据管理工作。数据资产管理包括数据资源化和数据资产化两个阶段。其中,数据资产化涉及数据资产估值、数据资产运营、数据资产流通三大核心活动,主要目的是扩大数据资产应用范围,显性化数据资产价值收益。
为了让业务团队更好地理解数据资产、使用数据,需要对数据资产进行运营,持续地推动数据资产价值释放。中国信通院联合30家企业,提出具有普适性的数据资产运营框架,定义了数据资产的规划、识别、应用、推广、优化等关键环节,以解决企业数据资产摸不清、数据资产运营能力差、数据资产价值难发挥等问题。
趋势4:数据价值评估是数据资产“入表”的前提
2023年8月,财政部发布《企业数据资源相关会计处理暂行规定》,并于2024年1月1日开始施行,指出现阶段数据资源会计处理应当按照企业会计准则相关规定执行。但是从数据资源到可以“入表”的数据资产,中间还有很多难点需要击破,特别是从价值评估的角度,质量因素、应用因素、成本因素和法律因素都会对结果带来关键影响。
关于数据资产估值业界有很多探索,但都停留在方法论层面。何宝宏认为,企业围绕数字化场景进行非货币化价值评估是比较现实的,在此基础上,未来可以进行货币化的转化。当前信通院正在与一些头部央国企、银行,围绕企业数据应用场景开展数据资产估值落地实践,制定了七大估值步骤和详细的实施方案,预计明年年初将产出首个细粒度的估值实践,为数据资产入表做好前期准备。
趋势5:人工智能数据治理需求迫切
通用人工智能的发展,使得数据与算法的边界愈加模糊,数据嵌入到模型生成中,数据质量与安全直接影响模型结果。然而面向人工智能的数据治理面临诸多挑战:一是方法论缺失,目前面向人工智能数据治理的方法刚刚开始,尚未形成结构化数据管理框架,相关技术工具也不成熟,亟需从理论框架、技术工具、产业实践等方面构建体系;二是数据集质量评价体系不完善,面向人工智能训练的数据集质量评价体系需要考虑代表性、可追溯性等,并兼顾公平性、非歧视性等因素,具备量身定制的工程化能力;三是数据安全与隐私保护的挑战,大模型生成过程中涉及大量安全问题和隐私问题,包括知识侵权、个人信息的违规收集、数据不安全传输、数据恶意篡改等内容,如何在模型生产、使用、运营整个全生命周期建立起数据安全和隐私保护能力,需要进一步探索。
目前,中国信通院正在积极探索推进人工智能数据治理的发展。中国信通院已牵头启动编写《人工智能数据治理白皮书》,人工智能数据安全风险评价标准也正在制定过程中,还将推进可信数据集流通及质量评价方法的标准制定,形成数据工程化的方法。
趋势6:数据安全落地规模与深度逐渐加快
首先,随着数据资源整合共享与开发利用进程加快,数据安全进入了流通安全的深水区,组织机构的数据资源将逐渐由组织“内”流通向组织“外”流通演进。流通环节责任主体增多,流通频次和范围增加,数据安全的风险暴露面也随之增加,需要面向责任主体和流通环节设计更细致的数据安全责任划分。
其次,人工智能技术快速应用于各行业场景,在驱动数据分类分级、数据安全风险监测等数据安全治理工作向智能化、高效化、精准化演进的同时,也带来了新的数据安全问题。
最后,随着数据生态日益复杂,各种数据角色陆续进场,安全风险愈演愈烈,安全能力运营愈发关键。数据安全运营能力的构建能够打破各组织既有数据安全产品间的壁垒,实现策略的有效整合,是提升数据安全工作成效的关键。
中国信通院推出了数据安全治理能力评估框架,定义了数据安全治理概念和细则,配套了能力建设方法论,指导企业了解现状、评估差距、开展能力建设。