通信世界网消息(CWW)国家数据局、全国数据标准化技术委员会(以下简称“数据标委会”)的成立,对我国数据产业发展产生了重要影响。数字经济时代,数据要素能否成为新的经济增长点,关键在于数据政策引导、数据立法、数据理论研究、数据标准化、数据产业培育等多个环节的完善程度。其中,前三者属于对数据的认知范畴,数据产业培育是具体的实践活动,而数据标准化则在“知”与“行”之间起到了承上启下的关键作用。9月25日,国家发展改革委、国家数据局、中央网信办、工业和信息化部、财政部、国家标准委联合印发了《国家数据标准体系建设指南》(以下简称《指南》),旨在充分发挥标准在激活数据要素潜能、做强做优做大数字经济等方面的引领和规范作用,指导数据领域标准的制修订和协调配套。本文对《指南》进行了解读分析和展望。
发布背景
工业经济的生产要素是资本、技术、劳动力,而数字经济的核心生产要素是数据。2020年我国首次在政策层面将数据列为“第五大生产要素”,成为国际上首个将数据列入生产要素的国家;2022年我国颁布了“数据二十条”;2023年我国成立国家数据局,该部门负责协调推进数据基础制度建设,统筹数据资源整合共享和开发利用,推进数字中国、数字经济、数字社会规划和建设等事宜。
国家数据局成立1年来,先后发布了《数字经济2024年工作要点》《“数据要素x”三年行动计划(2024—2026年)》等重要政策措施,成立了数据标委会。综上所述,数据要素领域工作已进入“深水区”,呈现出理论创新、体制机制创新、科技创新、产业创新、商业模式创新和实践标准创新同步发展的态势,这也充分反映了当前数字科技领域蓬勃创新的特点。
四方面明确数据标准体系建设要求
《指南》从总体要求、建设思路、建设内容、组织保障四个方面明确了国家数据标准体系建设的相关要求。
从总体要求来看,要遵循国家“数据二十条”政策、数字经济发展规律,持续开展数据领域的相关研究。在目标方面,既有定性目标也有量化目标,定性目标为数据“供得出、流得动、用得好、保安全”,形成一批标准应用示范案例,建成标准验证和应用服务平台,培育一批第三方标准化服务机构;定量目标是到2026年制定30项以上的通用型国家标准。定量目标容易实现,但是定性目标难度较大,对定性目标实现程度的评估也颇具难度。
从建设思路来看,要以数据“供得出、流得动、用得好、保安全”为指引,构建数据标准体系。数据标准体系结构包括基础通用、数据基础设施、数据资源、数据技术、数据流通、融合应用、安全保障7个部分(如图1所示)。
图1数据标准体系结构
数据标准体系框架是数据标委会下设WG工作组时的重要参考依据,当前数据标委会已设立6个工作组,即WG1总体工作组、WG2数据治理标准工作组、WG3数据流通利用标准工作组、WG4全域数字化转型标准工作组、WG5数据技术标准工作组和WG6数据基础设施标准工作组。目前WG2与WG3有一定的职能交叉,就当前情况而言,数据治理、数据确权、数据流通、合规交易是从数据资源到数据资本端到端系统化考量的问题,它们不可割裂,预计后续会有所调整。
从建设内容上看,主要是数据标准体系构成。数据标委会的筹建通知是在2024年5月第七届数字中国建设峰会上由国家标准委提出的,当时明确聚焦数据资源、数据技术、数据流通、智慧城市、数字化转型、数据基础设施、数据安全7个方向进行标准制修订工作。《指南》保留了数据基础设施、数据资源、数据技术、数据流通、数据安全5个方向,加上了基础通用、数据融合应用2个方向,形成了《指南》提出的基础通用、数据基础设施、数据资源、数据技术、数据流通、融合应用、安全保障7个部分,智慧城市与数字化转型纳入融合应用中。同时,基础通用标准有利于统一对数据的认知、管理口径,这是非常必要的基础工作,对其他领域标委会制定国标与行标、各省市制定地方标准有重要参考价值。
具体到所描述的内容,有些内容与全国信息技术标准化技术委员会(TC28)、中国信息安全标准化技术委员会(TC260)、全国通信标准化技术委员会(TC485)存在较多交叉,预计国家标准委后续在数据标委会层面的协调工作量会比较大。尤其是在融合应用层面,数据标准体系中仅提出了12个领域,而按照《国民经济行业分类》2019年修改版,我国行业分为20个门类、97个大类、473个中类、1382个小类,大多数行业都是往数字化方向发展,如果按照行业进行分组分类,标准体系并不能完全覆盖所有类型。同时,截至2023年底,我国共有国家级专业标准化技术委员会1338个,几乎全部与融合应用的内容有所重合,标准制定的专业跨度较大。因此,这种以行业进行分类的方法还有待完善。
从组织保障来看,分为与其他标准制定组织的协调联动、数据标准化公共服务平台、标准宣贯与数据人才培训、数据产品第三方检验检测、参与国际标准化活动等。整体来看,协调联动的工作量会比较大,组织保障层面需要加强与数据立法方面的联动。
标准体系编制的重点
基础通用标准
基础通用标准涉及术语、参考架构、管理、服务、产业等。标准属于低语境使用范畴,相对于沟通交流的高语境而言,是高度统一、规范化的语言应用场景,核心是达成一致、统一共识。特别是在术语层面,需要统一数据、大数据、数据资源、数据资产、数据治理等关于数据名词概念的内涵与外延。另外,对于数据产业也要分类清晰才能方便统计,就像数字经济增加值与数字经济核心增加值有很大差异一样,数据产业有很大的渗透与带动效应,因此数据产业也要有泛在的增加值与核心增加值,并衍生出监测指标体系,以便全国及各省市数据局对数据产业加以统计、管理。
数据基础设施标准
数据基础设施标准包括存算设施、网络设施、流通利用设施等。目前中国通信标准化协会(CCSA)在存算设施、网络设施领域制定了大量的各级标准,体系已经基本完善,但是流通利用设施标准的制定工作还需要加强。数据接入、数据传输、流通平台、流通应用是当前数据领域通用标准的薄弱环节,在智慧园区、智慧工厂等现场数据采集场景下,由于数据接口的兼容性不足、数据格式与协议的不统一,带来了广泛的数据采集问题,通过规范进行统一是数据采集的基础;流通平台是数据交易的核心设施,流通平台应提供数据登记、确权、交易、结算等“一站式”服务,支持多种数据产品和交易模式,同时,平台应具备智能匹配和推荐功能,帮助数据供需双方快速找到合适的交易对象。
数据资源标准
基础资源、数据开发利用、数据主体、数据治理、训练数据集等标准制定的工作量特别大,尤其是基础资源标准的元数据、主数据、数据目录,相当于给有形、无形事物(行为)进行统一编码。在数据开发利用标准所涉及的数据开放、数据共享、数据授权运营、开发利用能力等方面,数据授权运营标准的制定是最难的。当前各地市政府有大量的数据资产亟待变现,也期待充分释放数据价值、创新发展模式,以数字经济推动经济社会高质量发展,然而由于数据涉及个人隐私和产权“三权分置”,在数据立法、数据规范尚未健全的情况下,部分工作无法正常开展。数字经济的核心是数据,数字经济发展的下一个阶段是以人工智能为核心的智能经济,而数据又是人工智能的“精神食粮”,因此要注重数据产业与人工智能产业协同发展。《指南》提出主要规范适用于大模型训练数据集的合成要求,包括训练数据集合成技术、服务、工具、检测要求等标准。实际上,大模型只是AI的一个应用场景,无人驾驶、城市大脑、人形机器人、工业机器人等都需要机器学习的数据集。如果数据产业发展不充分,那么人工智能产业发展就不可能良好。
数据技术标准
数据技术标准包括数据汇聚技术、数据处理技术、数据流通技术、数据应用技术、数据运营技术、数据销毁技术等,其中最大的难点是技术接口与协议,用于规范不同行业、不同供应商开发的软硬件能够兼容支持这些协议,确保平台与平台、硬件与硬件之间可以正常互联互通,打破数据“孤岛”。
数据流通标准
数据流通标准包括数据产品、数据确权、数据资源定价、数据流通交易等。数据产业归根到底是市场经济行为,在数据共享交换、数据交易中,数据市场发展的前提是数据权利拥有者得到收益。首先要进行数据确权,尤其是明确自然人与企事业单位、政府之间的数据权利边界,确保私权利得到保护与利益反哺,如此,整个数据市场才能健康发展。对于数据资源定价,成本法、收益法、市场法都无法准确定价,数据价值的大小是由使用者的使用场景来决定的,而且数据与其他商品不同,可以在同业竞争等排他协议的前提下,多次销售给不同的用户,因此只能说是价高者优先获得数据的使用权,而不是仅有价高者才能获得使用权。同时,由于数据对于不同使用者而言价值各异,所以销售方难以待价而沽,且数据产生的收益分成也无法清晰地审计和结算,成本过高。在笔者看来,采用“数据银行”方式集中竞价将成为数据交易未来的发展趋势。
融合应用标准
这部分的分类来源于《“数据要素×”三年行动计划(2024—2026年)》重点行动的12个行业领域,实际上这些行业内部早已开展数据融合应用。这些行业的专业性很强,每个行业的数据标准化再由数据标委会统筹意义不大,而价值最大的是不同行业之间的数据交互与融合应用,如在应对极端天气时,应急、交通、医疗、气象、城管等部门之间需要高度协同,此时数据共享交换、集中智能分析、快速决策就非常重要。
安全保障标准
在数据基础设施安全、数据要素市场安全、数据流通安全等方面,CCSA和全国信息安全标准化技术委员会已经开展了大量的工作,在编标准也有很多。目前的工作重点是数据要素市场交易安全、流通安全,比如采用数据脱敏、数据隐私计算、多方联邦计算等方式,确保数据可用不可见。因此,数据标委会应该把工作重点放在数据流通安全上。
数据标准体系发展展望
数据标准体系专业分类向“横向联动”转变。数据只有流动起来才能实现价值最大化,产生巨大的社会效益和经济效益。因此数据标准体系的建设重点应该放在数据横向流动的“堵点”“难点”上,聚焦数据采集、数据资源、数据资产、数据共享交换、数据交易等环节。当前的七大专业工作组主要面向纵向的数据规范化问题,特别是融合应用方面,带有明显的垂直行业特色,未来有可能会从纵向转为横向的专业分类。
数据确权立法是完善数据标准体系的前提。数据流动与个人数据隐私、商业隐私之间存在天然的矛盾,如果数据确权问题不解决,数据隐私问题就无法确立,数据所有权、数据处理权和数据使用权之间的界限就不清晰。由此,数据确权问题在整个标准体系中应该放在首要位置,这也是当前的最大难题。数据确权已经超越了数据标准规范的范畴,属于立法层面,因而数据标准体系发展进程也受限于此。
跨界融合与标准化协同成为新趋势。随着数字技术的不断进步和应用场景的日益丰富,数据标准体系将更加注重跨界融合,推动不同行业、不同领域数据的互联互通。这就要求数据标准体系不仅要关注单一领域内的数据规范,还要注重跨领域的数据交互标准,促进数据在不同行业、不同系统之间的无缝流动和高效利用。同时,加强与国际数据标准组织的合作,推动国内数据标准与国际标准接轨,提升我国在全球数据治理中的话语权和影响力。
技术创新驱动标准体系升级。人工智能、区块链、物联网等新兴技术的融合应用,将对数据标准体系提出新的要求。数据标准体系需紧跟技术前沿,及时将新技术、新方法纳入标准体系,推动数据标准与技术创新的深度融合。通过技术创新驱动数据标准体系的不断升级和完善,提高数据标准的科学性、先进性和实用性。
强化数据标准实施与监督。数据标准体系的建设不仅在于制定标准,更在于标准的实施与监督。未来,数据标准体系将更加注重标准的落地执行,特别是涉及数据安全、数据隐私保护的领域,应建立健全数据标准实施机制,加强对数据标准执行情况的监督检查,确保数据标准的严肃性和权威性。同时,加大对违反强制性标准行为的处罚力度,形成有效的数据标准执行约束力,推动数据标准体系在数据产业发展中发挥更大的作用。