通信世界网消息(CWW)随着5G技术的迅猛发展与广泛普及,基站业务量的精准预测愈发关键。在多基站的场景中,预测工作不仅依赖于各基站自身的历史业务量信息,还需充分考量基站间的空间联系及其对预测结果的作用。本文聚焦于多基站情境下的业务量预测问题,探讨时间维度和空间维度如何影响基站业务量的预测成效,以期为相关研究与实践提供有益的参考和借鉴。
基站业务量预测概述
5G基站业务量预测方法成为了一种重要的技术手段,旨在提前感知流量的变化趋势,从而帮助基站进行资源的合理分配和调整,以满足用户的需求。然而多基站业务量预测属于复杂的时间序列预测任务。时间域方面,传统的数理统计和机器学习模型,在提取业务量数据特征的能力有限。近年来,深度学习模型因为擅长处理非线性数据,所以被开发应用于时间序列任务中。但卷积神经网络(CNN)卷积层的局部感知能力需要在模型中设置多层卷积和池化操作,通常难以捕捉长期依赖关系。循环神经网络(RNN)类的模型存在梯度爆炸和无法在硬件显卡中并行训练的问题。此外,在空间域方面,5G基站的业务量数据表现出明显的区域性特征。
图1 不同地区5G基站业务量的走势图
如图 1 所示,我们获取了来自高铁站、住宅区、高校等多个区域的真实 5G 基站业务量数据,并绘制出相应的业务量走势图。经分析发现,某高速路段的 5G 基站业务量呈现出显著的潮汐特性,其波峰与波谷的数值差异颇为显著。与之相对,某小区的 5G 基站业务量走势较为平稳缓和,并且在趋势上与高速基站的业务量走势表现出一定的趋同性。另外,公园区域的 5G 基站业务量数据中,波峰和波谷的出现时间相对更早。基于以上的分析,我们利用基站之间在空间上的相关性,进一步提高模型的预测精度。
GCformer时空预测模型
我们描述如何使用GCFormer模型来对5G基站的业务量进行预测,模型由空域和时间域两个子模块组成,如图2所示。空间域方面,我们根据多基站的工参和业务量数据对相关基站节点选择,得到邻接矩阵的空间数据。之后我们使用图卷积神经网络(Graph Convolutional Networks, GCN)模型提取基站网络的空间关联结构。时域方面我们将多基站的历史业务量数据,通过1D-CNN模块提取历史数据的时间段信息,其次将得到的数据输入到Transformer模型中。并且在Transformer的位置编码的分,我们通过TVOM(Time Variant Optimization Module)方法加入了周期项信息,提高模型捕获时序关系的能力。最后我们将时空两模块的输出特征进行融合,得到模型的预测结果。
图2. GCformer系统模型,包括通过1D-CNN和TVOM模块改进的Transformer类模型和通过基站节点选择并基于GCN模型的空间信息提取部分
图卷积神经网络和相关基站节点选择
图神经网络(Graph Neural Networks,GNN)是一种处理图数据的深度学习模型。与CNN, RNN等传统的深度学习模型不同,它能够处理非欧几里德空间的数据,对节点和边进行信息传递和学习,从而对整个图进行综合建模和分析。
图卷积神经网络(GCN)是 GNN 中的一种。相比于传统的 GNN,GCN 利用图形结构的信息,在节点卷积操作中使用邻接矩阵和度矩阵进行特征聚合,从而提取节点的高层次特征表示,反映出基站间复杂的网络拓扑结构,进一步准确地捕捉空间相关性。具体来说GCN 的核心就是在图形数据上定义卷积层。与传统的卷积神经网络不同,GCN 中的卷积层旨在利用图形结构,从相邻节点的信息中汲取有效的特征,而关系越亲近的邻居对当前节点的影响就越大。
在构建5G基站的邻接矩阵时,选择合适的基站节点是至关重要的,这不仅影响数据的准确性,还关系到网络优化的效果。基于此,我们运用三种方法来构建邻接矩阵:一是欧式距离法,即通过计算两基站间的直线距离衡量其物理接近程度,此为评估地理位置相近基站关系的基本方法;二是区域类型法,鉴于基站所处区域类型(如商业区、学校区、住宅区等)会对其业务量特性产生重要影响,故而依据区域类型将功能或位置相似的基站分组,以此明晰基站间的异同;三是业务量相似性法,借助余弦相似度、聚类等手段对基站间业务量数据展开分析,基于数据驱动从多维度揭示基站在业务量上的相似或差异情况,助力基站网络的理解与分析。
时间域模型和时变优化模块
Transformer模型是一种应用于序列建模的神经网络模型,因为其内部的Self-Attention机制以及Positional Encoding方法,使得该模型在文本摘要、语言翻译等自然语言处理任务中取得了优异的成绩。近年来,Transformer模型也被广泛应用其他领域的序列建模和预测任务。而5G基站业务量预测是一个时间序列预测任务,其中每个时间窗口都对应着基站的一段实际业务量。因此,Transformer 模型可以被用来对5G基站的业务量进行建模和预测,为相关的业务决策提供参考和依据。
图3 Self-Attention and Multi-head attention
此外,传统的Transformer模型根据输入数据位置的不同,通过Positional Encoding的方法增加输入数据之间的顺序关系。但是这种绝对位置编码的方法,在处理5G基站业务量数据时,缺乏可靠且针对性的时间序列的分析。因此,我们提出Time Variant Optimization Module(TVOM)增加Transformer模型中的时序信息。TVOM通过计算数据中的相关性,来提取5G基站小区的业务量数据的周期项信息,并将周期数据加入到Positional Encoding部分。
具体来说,我们利用Prophet模型分析5G基站用户数业务量数据,提取出具体的周期性信息。随后我们通过最小二乘法进行曲线拟合,该方法将设计的曲线数据和实际数据的误差作为目标函数,对拟合的曲线进行优化。通过最小化误差的平方值,来获得最优的多项式的系数,进而构造出周期项对应的的函数表达式。在训练模型的过程中,将小区ID作为匹配标签,根据输入数据的起始时刻对应替换周期项函数。从而弥补原始的Positional Encoding方法无法在时间序列数据中表示不足的问题。
总结
在这项研究中,我们根据5G基站业务量数据的时空特性,提出了一个深度学习架构GCformer。为了有效地描述多个基站之间空间相关性的关系,我们选取了基站距离、区域类型、数据相似度建立综合信息的邻接矩阵,并使用GCN模块提取其空间关系。此外GCformer的时间域模块继承了Transformer模型,使用Self-Attention方法提取业务量数据之间的关系,并且通过1D-CNN和TVOM模块进一步提升捕获数据中的时序信息。