通信世界网消息(CWW)人工智能(AI)和无线接入网络(RAN)融合能够革新网络基础设施、提高移动网络效率、降低网络运维成本,为电信企业带来新的商业机会,因而成为行业发展重要趋势。标准化的质量与成熟度是AI使能无线网络重塑与升级的关键,3GPP、O-RAN联盟等国际标准组织致力于探索AI与RAN的融合,并取得了一些进展。中国移动积极作为,在该领域发挥了技术和产业引领作用,主导了大数据采集、AI与RAN融合等多个项目,制定了统一的数据收集方案和功能框架,为网络自动化和智能化奠定了基础。
然而,AI赋能RAN的技术革新并非一蹴而就,AI模型训练数据获取、模型泛化性、模型传输等问题,都是当前标准化与应用实践中必须面对的挑战。为应对这些挑战,业界需要客观冷静地看待AI与RAN的融合,“产学研用”伙伴紧密合作,通过数据匿名化和去标识化、联邦学习、环境自适应的AI模型设计、基于参考模型算法结构的模型传输等潜在措施,共同推动AI技术在无线通信领域的创新应用,加速AI与RAN融合技术的成熟发展,为无线网络变革做好充分的准备。
AI与5G RAN融合的探索历程
随着移动通信技术的快速发展,网络规模和复杂性急剧增加,传统的网络管理方式效率低、易出错,且难以对复杂问题有效建模,亟需自动化、智能化的手段降低网络部署和运维成本,提升网络性能。以中国移动为例,目前已部署超过300万个5G基站,能耗和运维难度成为网络管理面临的重大挑战,亟需采用智能化解决方案来实现成本效益和运营效率的“双提升”。AI技术以其卓越的大数据处理和预测能力,深入分析海量数据,挖掘数据间的潜在关联,预测未来的趋势和结果,为无线接入网提供了更加智能化的管理手段。然而,目前基于AI的解决方案在现网中的应用仍存在局限性,例如,局限于单一厂商的网络设备,缺乏跨厂商的协同优化能力,且优化效果多局限于特定网元,无法全面扩展至网络与终端间的协同优化。为了克服这些局限性,亟待开展AI与RAN融合的全球通用标准制定工作。
3GPP作为全球通信行业的权威标准组织,其主导制定的标准涵盖了终端、无线接入网、核心网和业务端到端移动通信系统,为5G技术的发展提供了统一的框架和协议规范,是5G网络落地应用的基石。3GPP早在5G标准化初期就开始了AI赋能RAN的布局,2018年中国移动牵头的R16“RANcentric data collection and utilization”项目,通过定义统一的数据测量和自动化的数据收集方案,为5G网络自动化和智能化提供有力抓手,该项目为后续AI与RAN的融合奠定了坚实的基础。在此基础上,中国移动在R17版本牵头启动了首个AI与RAN融合的研究项目,主导了统一的功能框架和协议流程等顶层设计,打通了5G与AI融合的关口,同时对网络能耗、负载均衡和移动性管理等关键用例进行了针对性优化,正式拉开了3GPP RAN与AI融合的标准化序幕。
O-RAN联盟也是移动通信领域颇具影响力的组织,但与3GPP的技术广泛性、全面性不同,O-RAN联盟专注于开放式RAN架构的实现,强调接口开放化和网络智能化,以实现不同供应商组件之间的互操作性,从而简化网络管理、降低运维成本。无线智能控制器(RAN Intelligent Controller,RIC)是O-RAN定义的核心网络功能之一,主要是利用AI技术对无线资源的分配和使用进行组织、管理和决策,通过AI预测实现无线资源的合理分配,优化资源管理,提高网络效率和性能,提升用户体验,减少人工干预。O-RAN解决方案的开放性和灵活性,尤其适合垂直行业和私有网络的快速部署和业务模式创新。
除了传统的通信行业参与者,越来越多AI领域的公司也积极投身到无线通信技术的演进中,以期在即将到来的6G时代抢占有利地位。英伟达作为目前AI芯片领域的领导者,联合软银(投资了ARM)与爱立信等半导体公司,以及传统通信公司、软件公司和学术机构,在今年2月牵头成立了AIRAN联盟,重点关注通过AI提升RAN的性能、共享基础设施、在网络边缘部署AI服务等,以提高运营效率、为移动用户提供新服务。其本质是将AI能力从云扩展到管,通过定义AIRAN的系统架构、硬件平台等关键特征,辅助AI芯片公司进军传统RAN市场,通过提供GPU或基于GPU的虚拟基站(vRAN),实现其技术和产品的商业化。
3GPP标准组织中的“AI+RAN”项目简介
3GPP从AI重构智能无线接入网的可行性出发,启动了多项技术研究与标准制定项目(详见表1),旨在将AI技术与5G RAN深度融合,重点提升网络频谱效率、构建智能化运维体系、打造极致节能和资源管理等关键能力。在现有5G架构的基础上,3GPP通过对单点用例的针对性突破(详见附录),以AI统一功能架构和协议流程等顶层设计为驱动,以网络节能、负载均衡、移动性优化等多项关键能力智能化为代表,为“5G+AI”的深度融合、商用部署以及6G内生AI奠定了坚实基础。
表1 3GPP “AI+RAN”项目概览
为满足多样化的AI赋能需求,3GPP构建了支持多场景的AI统一基本功能架构(如图1所示)。AI基本框架囊括了数据收集以及模型训练、管理、推理、传输、识别、监控等模型全生命周期管理功能,不仅是5G网络智能化的基石,也为未来网络发展提供了强大支撑。
图1 AI统一基本功能架构
观察与思考:“AI+RAN”标准化及产业应用面临的挑战
业界普遍认同AI与RAN的结合具有显著的研究与应用价值,且不同标准组织在技术研究方向上形成了广泛共识。然而,AI与RAN的深度融合仍面临一系列技术和产业挑战,AI模型训练数据获取、AI模型的泛化性、AI模型传输等成为当前标准化与应用中面临的主要难题。
AI模型训练数据获取的挑战
在AI领域,数据是训练模型的基础,对于算法的准确性和效率至关重要。“AI+RAN”模型的数据集通常涉及网络拓扑、无线配置、信道条件、用户行为,以及终端、芯片的软硬件等信息,这些数据分散在运营商、网络厂商、终端厂商和芯片厂商之中,仅使用某一方的数据很难训练出性能良好的AI模型。因此,3GPP尝试通过标准化的方式统一数据集,但在解决方案的选择上仍然存在分歧。
1.各方都希望获取全面、丰富的数据集,用于训练先进的AI模型。先进的AI模型不仅可以作为企业的竞争优势,还能减少对外部供应商的依赖,确保企业在技术创新和应用上保持独立性。
2.由于潜在的隐私安全风险,各方不愿意把自己的数据分享出来。数据的共享可能会导致网络拓扑、网络配置、用户信息、终端及芯片内部实现算法等隐私或知识产权泄露,严重损害相关方的声誉和利益。
3.不同实体训练的模型因软硬件差异难以直接应用到另一方的设备上。例如,芯片厂商认为只有自己训练的模型才能与其芯片的软硬件适配。
面对上述挑战,潜在的应对方案包括:其一,通过数据匿名化和去标识化,减少隐私泄露风险;其二,利用联邦学习技术,允许数据保留在本地,同时实现模型的共同训练;其三,通过可信任的第三方实体统一管理数据,比如政府或国际标准组织建立的数据中心,能够确保数据的隐私安全,并促进数据的共享和利用,支持AI模型的训练和优化。
AI模型的泛化性
泛化性是评估AI模型的关键指标之一,良好的泛化性意味着模型在不同条件下均能保持稳定的性能。在无线通信领域,考虑到通信环境复杂多变,包括不同的网络部署、信道条件、用户行为、信号干扰等,AI模型的泛化性尤为重要。然而,AI模型的泛化性保障也面临以下挑战。
1.数据多样性:需要使用多样化的训练数据集,包含不同的场景和条件,以涵盖各种网络参数和信道环境,确保模型能够学习到足够多样的特征。但上文提到的数据隐私问题限制了多样化数据的采集和使用。
2.模型设计复杂:通常需要较为复杂的模型才能从训练数据中有效提取丰富多样的特征,但这样的模型往往伴随着更多的模型参数、更高的训练成本以及更复杂的模型推理。
3.终端存储和算力制约:现有5G终端设备由于存储和计算能力有限,无法支撑复杂的模型应用。但3GPP评估报告显示,小模型的泛化性普遍较差。
“AI+RAN”的设计需要在模型的泛化性、复杂度以及终端算力之间找到一个良好的平衡点,进而探索出既能适应多样化的无线环境,又能在算力有限的终端上高效运转的AI技术,才能实现RAN侧网络智能化的稳步落地。目前潜在的解决方案包括:其一,标准化的数据采集机制,通过更广泛、更丰富的训练数据,提升模型在不同区域和应用场景下的适用性;其二,基于环境感知的超网络模型设计,能够根据环境变化自适应调整模型,从而更好地适应不同的环境特征。
AI模型传输的困境
为了获得更好的性能,可以针对不同的网络参数或场景部署定制化的模型。然而,终端受限于存储能力,难以在本地存储多个模型。因此,在终端和网络等多个节点间进行模型传输,成为潜在的有效解决方案。
具体而言,模型传输可分为通过OTT服务器传输和通过基站传输两种方式,各有其优势和局限性。
1.OTT服务器传输模型方式:尽管OTT服务器具备模型训练和传输的能力,但难以实时获取当前的网络配置或场景信息,可能导致传输的模型不能适配当前环境。
2.基站传输模型方式:基站能够实时感知无线网络配置或场景信息,但不能掌握终端芯片软硬件实现信息,可能导致传输的模型与终端能力不匹配。此外,模型传输可能导致模型设计算法等知识产权泄露。
针对上述问题,基于标准化模型算法结构的模型参数传递成为一种潜在的解决方案,在定义若干种参考模型结构之后,基站仅需传递对应参考模型结构的模型参数。但该方案也面临着模型性能受限、参考模型结构选择困难、基站与终端之间的互操作性不足等严峻挑战,仍需进一步研究。
总结与展望
AI与RAN的融合是通信技术发展的一个重要里程碑,但新技术的发展总是充满了不确定性和挑战,我们需要以一种客观理智的态度来审视AI在RAN领域的应用。AI模型训练数据获取、数据隐私安全、模型泛化性、模型传输、模型训练和推理所需的额外算力、系统复杂度等问题,都是AI与RAN融合道路上的挑战。面对这些挑战,我们必须在AI模型的设计上寻求高性价比与高能效的最优解,通过持续的技术创新,平衡性能与成本,确保AI技术的实用性和可靠性。
同时,AI与RAN的融合也预示着产业链结构的潜在变革。AI技术的发展离不开高性能的CPU和GPU等计算资源,现有的产业链格局需要相应地调整和升级,以适应AI与RAN融合的发展趋势。中国在高端芯片领域受到的限制,以及由此引发的RAN智能计算芯片及其生态系统薄弱,给中国AI与RAN融合发展带来了挑战。
AI已成为全球关注的焦点,为各行各业带来了前所未有的机遇,业界普遍认为6G初期引入AI功能将开启一个高度智能化、自动化的通信新时代。为了在下一代通信技术的竞争中占据有利地位,国内产业界需要加大研发投入,促进“产学研用”的深度融合,加速自主技术创新的步伐,同时加强国际合作,促进AI与RAN融合技术的发展与成熟,构建AI与RAN融合的生态系统,为实现更智能、更高效的无线通信网络奠定坚实的基础,为6G时代的到来做好充分的准备。
定位增强
在5G NR定位技术中,非视距(NLOS)场景下的定位精度一直难以提升,为突破这一限制,3GPP研究了基于AI的直接定位和辅助定位两个子用例。通过在终端、基站或定位服务器(LMF)部署AI模型,分析用户位置数据和信道状态信息,从时、频、空等多个维度提取深层次特征,预测和校正基站间同步误差等非理想因素,有效克服了NLOS场景下传统定位算法失准的痼疾。
仿真结果表明,该技术可实现亚米级的定位精度,有效扩展了5G定位技术的应用场景。
网络节能
5G基站能耗问题备受瞩目,网络节能成为助力“双碳”目标实现的关键。传统的小区激活与去激活、负载降低和覆盖调整策略虽有效果,但操作不当可能损害网络性能或增加能耗。为解决此问题,3GPP拟在基站侧部署AI模型,分析服务基站和邻站的资源及能耗数据,预测网络能耗效率和小区负载状态,优化小区激活与去激活策略,包括关断时机、时长及负载分流策略,实现系统性能与节能效率之间的平衡。仿真评估表明,与传统方法相比,加载AI功能的小区节能时间增加了至少90%。
负载均衡
5G网络负载均衡是提升运营效率与用户服务质量的关键,但是传统方案受限于调整策略滞后、流量调度不均衡、网络配置复杂、运营成本高等问题。在基站侧部署AI模型,能够实时预测服务基站及邻站的资源使用状态、终端的RRM测量结果,制定精确的负载均衡策略,包括待切换的候选终端、目标小区选择及切换时机等。此外,还能基于终端切换后的吞吐量、时延、丢包率等反馈信息持续优化模型。
移动性增强
移动性管理是5G网络的基本功能,对于维持用户在移动场景下的通信体验至关重要。随着5G网络频段升高,基站覆盖范围缩小,终端的切换行为愈加频繁,终端功耗面临更大挑战。同时,新兴业务对于移动过程中的业务连续性、可靠性和时延等提出了更高要求。在终端或基站侧部署AI模型,能够基于空、时、频域预测小区测量结果,减少终端测量开销和功耗。此外,AI模型还能预测测量事件、无线链路失败发生的时间或概率,从而提前进行切换准备,避免切换失误。
附录:3GPP标准中引入AI技术的主要用例
CSI反馈增强
在无线通信中,CSI信息对于提升网络频谱效率至关重要,然而传统CSI码本反馈精度低、高速移动场景上报时延高。针对这些问题,3GPP研究了基于AI的CSI压缩反馈和CSI时域预测两个子用例。对于CSI压缩反馈,通过终端侧的AI编码器高效提取信道信息的关键特征,以极少的比特传输给基站,大幅降低了空口传输开销。同时,基站侧的AI解码器能准确还原原始信道信息,实现了高效压缩与精准恢复。基于AI的CSI时域预测如图2所示,通过在终端侧部署AI预测模型,基于历史CSI数据预测未来信道状态。仿真评估表明,这种基于AI的预测方案能提升系统平均吞吐量约10.6%,显著优于传统方法。
图2 基于AI的CSI时域预测
波束管理增强
针对高频通信场景终端波束测量开销大、高速移动场景波束指示精度低等问题,3GPP研究了基于AI的空域波束预测和时域波束预测两个子用例。空域波束预测如图3所示,部署在终端或网络侧的AI模型可以通过有限波束测量,快速预测全局最优波束。与传统方法相比,基于AI的空域波束预测不仅能大幅减少终端测量开销,还能提高波束预测准确率约70%。时域波束预测如图4所示,AI模型可以根据历史波束测量结果预测未来最优波束。仿真显示,基于AI的时域波束预测方案能提升预测准确率约60%。
图3 空域波束预测
图4 时域波束预测
*本篇刊载于《通信世界》8月10日*
第15期 总949期