通信世界网消息(CWW)在大数据时代,数据已成为企业和社会关注的重要战略资源,对于海量、高速增长的数据资产,需要用新的治理模式才能激发数据活力、提升数据资产价值。本文旨在研究如何有效开展数据治理实践工作,解决数据治理项目落地问题。
数据治理最佳实践分析
2017年,多家咨询公司与研究机构对世界范围与北美企业的数据治理情况进行了调查,调查结果显示,在世界范围内有50%的企业正在或已经实施数据治理,而在北美已有79%的企业正在或已经实施了数据治理。
国际商业机器公司(IBM)的数据治理源于其在上个世纪九十年代的企业转型需求,其计划从一家硬件制造的企业转型为软件服务业的企业。数据治理在其转型中对流程、数据及架构的标准化活动提供业务数据标准化以及数据架构标准化支持。在具体的数据治理体系方面,IBM将其数据治理体系分为支持领域、核心领域、治理使能器及治理结果等4个领域。
其中,支持领域包含“数据架构”“数据分类和元数据”及“审计、日志和报告”三个部分;核心领域包含“数据质量管理”“数据生命周期管理”“数据安全、隐私与合规”三个部分;治理使能器包含数据治理的组织、政策制度及认责机制等保障机制;治理结果对治理核心的核心活动提出需求。
目前,国内企业的数据治理实践活动因行业而异。银行业由于对信息资产的依赖性较高,因此数据治理项目起步早、落地快、力度大。在一些高科技行业和能源行业领域,数据治理启动也较早,并由公司高层推动,深度与广度都较大,治理体系较成熟,因此其数据治理活动也较有代表性与借鉴意义。
通过对国内外数据治理先进实践进行总结分析,可以提炼出4点最佳实践。
一是高层与业务支持。数据治理项目需要获得高层的支持以及相关业务部门的重视,需要强力部门推动,并保证资源到位,自顶向下和自底向上相结合,分阶段实施完成、落实责任。
二是治理的范围与深度。明确数据管控的范围,确定数据治理体系内容,形成认同一致的数据治理框架,如对数据主题域划分、数据实体识别等。
三是治理组织建设。数据治理的组织是数据治理的保障,这个组织应跨业务、跨部门地覆盖企业;确立组织中的认责机制,确定管理职责与管理流程方法。
四是治理项目实施。数据治理工作不可能一蹴而就,而是一项需要分步开展、持续维系、稳步提升的长期工作。
数据治理活动实践分析
数据治理工作包括数据资源目录管理、数据模型管理、数据标准管理、数据质量管理等方面。
数据资源目录管理
数据资源目录管理是整个数据治理体系的首要工作,是构建企业数据架构体系的基础工作。数据资源目录管理核心目标是将企业的数据资源进行分层划分,形成统一的数据资源目录,提供各业务主题域所需的资产导图,获取所属领域的数据资源内容信息。依据业务需求分析的实际情况,将资产目录划分为多个层级,一般可分为主题域、子主题域、数据实体。
数据模型管理
数据模型的管理是基于数据资源目录中梳理出来的数据实体,进行数据属性信息梳理,最终构建逻辑模型的过程。从业务角度抽取出来的数据实体及其属性信息是一个标准的数据逻辑模型,用于指导新建系统开展物理模型的设计和开发;对于已建系统的现有物理模型,需建立与标准逻辑模型间的映射关系,保障跨系统数据模型的一致性。
数据标准管理
数据标准管理是统一数据语言的核心工作,保证数据在各业务域和各信息系统之间的一致性,为信息系统间数据共享交换提供保障,提高系统间交互效率为数据共享奠定基础。数据标准是对数据的定义与解释,具体是基于数据实体的属性开展的,每个属性的标准包括数据的业务规范、管理规范、技术规范以及值域4个部分。
数据质量管理
数据质量管理重点工作聚焦在制定数据质量评估体系、发布数据质量评估模型实例、执行数据质量评估、展示数据质量评估报告以及数据质量问题改善与跟踪。数据质量评估体系是数据质量管理的基础,质量评估体系包括对数据质量评估模型的定义、数据质量评估指标体系的搭建。
数据治理的风险与对策
数据治理工作是一个庞大的工程,结合国内外企业实施数据治理的经验和教训来看,数据治理工作具体有以下几个方面的风险与对策。
一是全面提高思想认识。
现在企业已普遍意识到数据是宝贵资产,尤其意识到数据质量的重要性,但是对数据治理的重要性认识不深刻,因此建议数据治理首先要从上到下全面提高思想认识,保证在企业的各个环节都能重视数据治理。
二是业务部门与信息部门密切配合,共同推进数据治理。
数据治理工作必须遵循业务主导的原则,因此在项目实施前和实施过程中需要获得各业务域对数据治理工作的认知,尤其是业务部门有责任牵头解决项目实施过程中本主题域内遇到的业务和组织方面的核心问题,应抽调业务骨干,积极参与项目的实施。
三是积极探索数据治理落地运作方式。
数据治理工作普遍存在方案规划容易,落地实施困难的问题。建议在项目实施前认真讨论项目的实施计划和运作方式,理清本项目与其他项目组间的工作范围、边界、责任,要明确本项目主题域及其数据治理重点业务需求。
四是建立评价标准,解决数据治理效益估算难的问题。
数据治理工作属于基础工程,项目收益无法直接体现。常常会出现数据治理后无法估算出直接经济效益的情况,最终出现用户对治理结果满意度低的问题。因此需要建立一套数据治理效果评价标准,有助于对数据治理项目的落地结果进行评估。