数据基础设施建设的 探索、实践与发展建议

作者:中国信息通信研究院 郜蕾 责任编辑:包建羽 2024.07.05 15:58 来源:通信世界全媒体

通信世界网消息(CWW)数据基础设施是数字经济时代面向数据要素的基础设施。随着数据要素市场化配置改革步伐加快,配套基础设施面临新的要求,迫切需要构建适应数据要素特征、促进数据流通、发挥数据价值的数据基础设施。美欧等部分发达国家的数据基础设施建设探索起步较早,我国产业界和学术界近年来也围绕数据基础设施建设的不同路径开展了积极探索。为促进数据“供得出、流得动、用得好、保安全”,我国亟需加强数据基础设施整体谋划和统筹布局,打造安全可控、高效流通的国家数据基础设施体系,夯实数字经济发展和数字中国建设的基础。

国内外数据基础设施建设实践

世界主要国家数据基础设施建设实践

自20世纪末以来,美国、欧盟、英国、日本等发达国家和地区围绕数据资源开发利用的基础设施开展了多种探索与实践。美国政府在1993年提出了“国家空间数据基础设施”概念,并于1994年启动国家空间数据基础设施建设,制定了国家空间数据标准。此举引发各国高度关注并纷纷规划建立自己的国家空间数据基础设施。此后,美国先后于2003年启动了《国家空间数据基础设施远景规划》、2014年出台了《美国国家空间数据基础设施(NSDI)战略规划(2014—2016)》。美国政府在2009年建立了开放政府数据平台Data.gov,主要发布联邦政府、州政府和企业的数据、工具及API接口。同年,英国政府启动建设政府数据开放平台Data.gov.uk,开放了商业与经济、教育、环境、健康、地图等14类数据集。2020年,欧盟委员会出台了欧盟顶层数据发展战略——《欧盟数据战略》,提出要创建一个向世界开放的欧盟单一数据市场,实现在欧盟范围内安全地跨行业、跨领域共享和交换数据,重点发展以数据空间为核心的数据基础设施,计划建设制造业、交通、健康、金融、能源、农业、公共管理等10余个领域的公共数据空间。目前,欧盟的数据空间已在医疗、能源、交通等领域试点。

目前,国外尚未对数据基础设施概念和建设路径形成共识。各国大多聚焦政务数据开放平台和数据集建设,数据流通交易平台大多由技术厂商自行搭建,缺乏统筹建设和有效监管,容易形成“数据孤岛”,存在数据泄露和滥用等风险。对于个人数据的开发利用和市场化运作尚未形成可持续的商业模式,对数据基础设施建设模式的探索有限。但主要国家均将数据采集、传输、存储、处理、管理、应用、保护等全流程所涉及的软硬件设备、数据集、技术,以及标准规范、流程机制、人员等纳入数据基础设施的范畴。

我国数据基础设施建设的探索与创新

近年来,随着我国大数据产业持续快速发展,区块链、隐私计算等数据可信流通技术成为创新最为活跃的领域。产业界、学术界积极开展不同技术路径的数据基础设施建设方案探索,涌现出一批数据基础设施解决方案和产品,比如北京大学的数字对象语用网、中国移动的数联网(DSSN)、中国信息通信研究院的可信数据空间(TDM)、中国电子的数据金库等。

可信数据空间是中国信息通信研究院于2022年联合华为等头部企业和机构提出的,并成立了可信数据空间生态组织。可信数据空间构建了一个安全可控的数据流通和使用空间,通过对数据使用权进行控制,避免数据不受控地复制、传播和滥用,为数据在不同地区、不同主体之间流通和使用提供信任机制,实现数据流通“可控可计量”。可信数据空间主要应用于金融、医疗等对数据安全性和可信度要求较高的场景。

基于数字对象架构的数联网由以北京大学计算机学院黄罡教授为核心的团队提出,数联网是建立在互联网等通信网络之上、以数据为中心的虚拟数据网络,目前已在山西省广域数联网、国家电网能源数联网、工业互联网数据要素登记确权、药品现代化监管等多个领域得到落地应用。

中国移动于2023年4月提出数联网,并在11月推出了“数联猫”产品。该数联网是依托中国移动的连接和算力能力,基于隐私计算、区块链、低代码开发等技术,构建的服务数据跨行业、跨区域、跨机构流通的基础设施。通过对传统网络设施升级改造,在算力网络之上搭建数联网和数据流通共享平台,利用“数联猫”为用户提供快速就近接入、数据互通互认和一体化交付服务。

中国电子的数据金库是基于存用分离思路,打造的“一库两网,三级节点”的数据安全流通基础设施。其中“一库”是数据金库,用于存储关乎国家安全和长期发展的核心数据、重要数据以及数据元件;“三级节点”指搭建国家、省、市三级架构,对数据和元件进行分类分级存储和管理。

目前数据金库已在徐州、大理等六个城市的政务、金融、城市治理等领域得到落地应用。目前,上述各类数据基础设施均具备较完善的体系架构和一定实践基础,都是以安全可控作为基本要求,综合运用隐私计算、区块链、使用控制等多种技术,以满足数据登记、身份认证、可信流通等需求,并以分层部署的“全国一张网”为建设目标,促进跨区域数据基础设施互联互通互认。而各类建设方案的区别主要在于流通层面采取的技术实现方式不同。

我国数据基础设施内涵及架构

我国数据基础设施概念内涵

自党的十九届四中全会将数据列为一种重要生产要素后,“数据基础设施”的概念受到产业界和学术界高度关注。根据国家数据局党组书记、局长刘烈宏在2023年11月出席第二届全球数字贸易博览会“数据要素治理与市场化论坛”时的论述,数据基础设施是以数据为核心,在网络、算力等设施支持下,以数据价值释放为目标,面向社会提供一体化数据汇聚、处理、流通、应用、运营、安全保障服务的一类新型基础设施,是覆盖硬件、软件、开源协议、标准规范、流程机制等的有机整体。目前,各界对于数据基础设施的内涵和范畴基本形成共识。

我国数据基础设施层级架构

我国数据基础设施应具备数据汇聚、数据处理、数据流通、数据应用、数据运营、安全保障等核心能力,提供“采-存-算-管-用”全生命周期的大规模数据流通与应用支撑能力。

由于不同地区、不同行业的数据基础设施存在差异,为加强数据基础设施的统筹布局和协调发展,参考国家政务数据资源体系的分层级架构,我国数据基础设施的组织架构可分为国家、地方/行业、企业三个层级,各层级的建设思路和服务对象各不相同。国家级数据基础设施由国家机构统筹建设运维,主要实施全国范围数据流通监测、管理、调度,通过建立跨区域、跨行业数据共享机制,开展跨区域、跨行业数据资源统筹管理、资源盘点和流通监测,为跨区域、跨行业数据流通交易提供身份认证、备案存证核验等服务。地方/行业级数据基础设施是按照国家的统一框架和技术标准建设或改造而成的数据基础设施,主要负责区域内各级政府部门或垂直行业内相关单位的数据采集、存储、共享、交换和流通应用,具备数据市场监测、数据目录、资源调度等能力,能够为企业级数据基础设施平台提供确权认证、合规审计、供需对接、交易备案等服务,地方/行业级数据基础设施应按规定与国家级数据基础设施对接。企业级数据基础设施是在国家统一的技术规范和流程机制要求下自主建设的数据管理和数据服务系统,在满足企业自身数据应用的基础上,还要与其他主体的数据基础设施互联互通,能够向上一层级数据基础设施提供数据产品、数据目录等信息,实现数据可发现、可访问、可流通。

我国数据基础设施建设思路及发展建议

数据基础设施建设推进思路

我国应在充分利用各地、各行业现有数据基础设施的基础上,按照“统筹谋划、需求导向、试点先行、互联互通、安全可靠”的原则,建立完善数据基础设施顶层设计,制定出台引导数据基础设施建设的政策。按照统一的体系框架和技术标准规范,在一些数据产业发展基础好、发展需求强烈的地区或行业开展数据基础设施建设试点,丰富数据基础设施服务类型和应用场景。通过市场化方式遴选若干数据基础设施技术方案和建设运营主体,建立不同层级数据基础设施互联对接机制,促进跨区域、跨行业数据安全高效流通,逐步形成符合中国国情、高效流通、安全可信的国家数据基础设施体系,为构建全国统一的数据要素大市场,全面支撑数字中国、数字经济和数字社会高质量发展夯实数据底座。

发展建议及保障措施

1. 加大高质量数据资源供给

一是加快公共数据汇聚。完善省、市两级政务数据平台,提升政务数据质量,加强水电气、交通等公共数据归集,规范公共数据的收集、存储、加工和治理。二是引导行业数据整合。引导企业加强自身数据采集和治理,支持行业龙头企业、互联网平台企业建设打通行业上中下游的数据平台。三是加大高质量数据集供给。鼓励行业主管部门、科研机构、互联网企业建设高质量的文字、图片、音视频等大模型预训练语料库和行业数据集。

2. 构建体系化的数据流通基础设施

一是统筹数据流通基础设施布局。基于统一的技术要求和标准规范,统筹布局国家级、地方级和行业级数据流通设施,支持可信数据空间、数联网、数据金库等不同技术方案的基础设施应用部署。稳步推进国际数据基础设施建设,与国外机构和企业合作建设跨国可信数据空间,鼓励先行地区建设面向跨境数据服务的国际数据中心。二是构建多层级数据交易设施。统筹构建国家级、地方级/行业级、企业级数据交易平台,引导地方级数据交易平台集约化布局。三是建设公共数据开发和授权运营平台。推进各级公共数据开放平台互联互通,制定全国统一的公共数据开放目录。四是有序发展数据流通支撑服务平台。鼓励各方利用数字化技术搭建合规审查、质量评估、数据资产评估模型库和规则库等平台,推动建设国家级、地方级数据资源登记平台,实现跨系统、跨区域、跨行业数据资源登记互认。

3. 统筹部署数据安全共性技术设施

一是构建互联互通的区块链基础设施体系。探索建设国家级区块链基础设施,提供数据确权存证、身份认证、监测管理等服务能力,支持同构链和异构链跨链互通。二是推动隐私计算技术应用部署。支持建设融合多方安全计算、联邦学习、可信执行环境等技术的隐私计算平台,鼓励行业龙头企业搭建隐私计算服务平台。三是增强数据基础设施安全保障能力。加强重要数据基础设施和关键业务系统的安全设施建设,强化数据加密、访问控制、安全审计、容灾备份等技术手段建设,提高数据基础设施威胁监测和应急响应能力。支持开展数据基础设施安全水平评测。

4. 培育壮大数据基础设施产业生态

一是加快数据基础设施应用推广。紧密衔接“数据要素×”行动,培育拓展数据基础设施在工业制造、现代农业、商贸流通、交通运输、金融服务、科技创新、文化旅游、医疗健康、应急管理、气象服务、智慧城市等重点领域的应用场景。鼓励各类数据基础设施建设运营主体开展产品服务创新和商业模式创新,提高数据基础设施普惠服务水平。二是培育壮大市场主体。加大对具有关键软硬件自主研发能力的数据技术企业的培育力度,引导数据合规审查、质量评估、资产评估等服务商规范发展,培育一批在细分领域服务能力强的“数商”,培育有生态主导力和全球竞争力的数据基础设施“链主”企业。

5. 制定数据基础设施标准规范并建立管理机制

一是加快标准规范的制定和完善。加快数据标识、数据目录、高速数据传输网、区块链、数据治理和开发、数据安全等方面的共性技术标准制修订,统一数据标识编码解析等底层标准协议,编制重点数据基础设施互联互通标准规范,明确身份认证和监测统计等环节的流程规范,完善我国数据基础设施标准规范体系。二是建立健全管理体制机制。建立国家级、地方级数据基础设施监测统计制度和相关平台设施,构建上下联动、分级管理的管理体制,制定数据基础设施建设运营主体准入管理办法,探索建立数据基础设施服务管理机制和数据跨境流动管理机制。

6. 开展数据基础设施建设试点和宣传推广

一是加快数据基础设施建设试点。在国家数据基础设施顶层设计的指引下,分阶段开展数据基础设施建设试点,统筹考虑“东数西算”、人工智能数据训练基地等设施布局,选择重点地区和行业围绕典型场景、重点环节开展试点示范,通过市场化方式选择和检验技术路线,逐步收敛形成符合我国数据要素市场发展需要的数据基础设施技术体系。二是加强数据基础设施建设的宣传推广工作。遴选一批数据基础设施建设试点项目,加强优秀案例宣传和培训交流,推动试点示范成果复制推广。

*本文刊载于《通信世界》总第946期 

2024年6月25日 第12 期 

通信世界网版权及免责声明:
1、凡本网注明“来源:通信世界全媒体”及标有原创的所有作品,版权均属于通信世界网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、凡本网注明“来源:XXX(非通信世界网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。
发表评论请先登录
...
热点文章
    暂无内容