通信世界网消息(CWW)“信令风暴”是指在通信网络中,由大量的信令请求或信令消息传输,导致的网络拥塞、延迟和性能下降等现象。随着5G时代的到来,核心网基础设施正在经历从专用设备向云化和分层解耦设备的转变。5G核心网和IMS(IP多媒体子系统)核心网利用NFV(网络功能虚拟化)技术在云上快速部署,虽然增加了网络的敏捷性,但也引入了可靠性风险。分层解耦的设计虽然支持多厂家协同部署,但也引入了健壮性不足的问题。此外,在网络架构方面,为了使5G网络具备解耦和弹性扩容的能力,许多网元被功能化,进一步增加了网元之间链路的数量和信令网络的复杂度,使得各种网络隐患不断叠加,为信令风暴的产生提供了条件。
近年来,国内外出现了多起由设备异常、承载网中断、灾害等引发信令风暴所导致的网络事故。例如,日本KDDI由于一台核心路由器在维护期间发生故障,导致语音流量无法正常路由至VoTLE交换机,引发部分VoLTE语音业务中断,这就是典型的信令风暴引发的事故。在工程师尝试回退操作,将连接重新切回旧的路由器后,大量终端用户几乎同时向VoLTE节点发起注册信令,请求重新连接至网络,导致短时间内信令流量激增,超出了网络处理能力,引发了端到端整网的信令风暴。信令风暴会导致网络长时间瘫痪,且在极端场景下,信令风暴会导致网络端到端的各个环节出现过载“雪崩”,业务长时间无法恢复。
信令风暴的影响
信令风暴对网络的影响主要体现在以下几个方面。
网络性能下降。当网络中出现大量信令消息时,网络设备(如移动管理实体MME、服务网关S-GW等)的处理能力将被大量消耗,导致信令处理延迟增加。这不仅影响信令消息的处理,还可能占用宝贵的网络带宽,导致数据传输速率降低,影响数据业务的正常运行。
用户体验受损。信令风暴会导致服务请求时间延长,例如语音呼叫建立时间延长,数据业务连接建立延迟增加,从而影响用户体验。在严重情况下,可能出现通话质量下降(如语音断续、通话延迟等)的现象。
网络安全风险增加。信令风暴可能被恶意利用,作为分布式拒绝服务(DDoS)攻击的一种手段。攻击者通过发送大量信令请求,使网络设备过载,导致正常的服务请求无法得到响应,严重时甚至会导致网络设备宕机、安全防护措施失效,进一步威胁网络的安全性。
综上所述,信令风暴不仅影响网络正常运行,降低网络性能,还可能干扰用户体验并对网络安全构成威胁。因此,网络运营商和设备供应商需要采取有效的措施(如优化网络结构、增强设备处理能力、实施信令流控等),以预防和应对信令风暴的发生。
信令风暴的预警与处理
按照山东省“十四五”数字强省建设规划部署要求,山东移动从网络规划、建设、维护、优化的全生命周期角度出发,强化安全管控能力,积极探索智能化网络建设,致力于打造具备风险感知及预测能力的智能化IP网络。
山东移动与华为公司展开深度合作,基于华为核心网守护系统提供的数字孪生技术,对网络进行冲击流量仿真,评估网络的信令风暴应对处理能力及瓶颈,给出优化建议(如流控参数优化配置推荐或网络扩容建议),以支撑网络进行安全加固,降低故障发生时对业务的影响。通过上述措施,山东移动实现了信令风暴的预测预防,提升了网络运行的安全水平,为用户提供更加稳定、可靠的网络服务。
同时,山东移动采用了华为的流量视图技术,实现核心网业务流量的可视化,包括全网、网元组、单网元三个层次的网络可视,以及基于拓扑视图渲染的告警信息,全面呈现流量事件和风暴隐患,支持过去3天的历史流量数据回放,为网络运维提供更加直观、便捷的工具,提升了网络运维效率和响应速度。
AUTIN实践说明
AUTIN(一种网络优化工具或系统)在实践中可以通过以下方式辅助应对信令风暴。
第一,物理组网可视化。AUTIN利用网络数字孪生技术,将实际的设备组网以1:1的比例映射为网络拓扑图,整合网元的KPI(关键性能指标)、告警、MML(人机语言)命令、配置信息等数据,实现全网状态的可视化,将网络状态实时且直观地呈现出来。在信令风暴场景下,这有助于运营商实时掌握信令风暴对业务的影响程度及范围。具体如图1所示。
图1 利用AUTIN实现物理组网可视化
第二,智能评估网络信令风暴风险。AUTIN周期性地采集现网KPI、告警、流控参数等数据,结合多场景信令风暴冲击模型,通过数字仿真技术模拟信令风暴冲击情况,评估网络是否存在信令风暴风险。系统能够自动识别瓶颈网元,并推荐最佳流控参数,输出风险评估结果和配置优化建议,从而及时预防网络隐患。具体如图2所示。
图2 利用AUTIN智能评估网络信令风暴风险
第三,在信令风暴之后快速恢复系统功能。通过预置的信令风暴匹配规则和专家经验,结合现网数据异常特征,AUTIN能够识别异常网元,自动生成应急恢复脚本样例,实现发生信令风暴15分钟之内快速恢复,避免影响进一步扩大。具体如图3所示。
图3 在信令风暴之后快速恢复系统功能
第四,快速定位信令风暴源头。在快速恢复系统功能后,AUTIN将信令风暴发生过程中的网络拓扑、网元状态、KPI、告警、事件等信息按照时间顺序在拓扑界面回放,辅助定位信令风暴源头,防止二次冲击,确保网络的稳定运行。具体如图4所示。
图4 通过AUTIN快速定位信令风暴源头
结束语
近年来,山东移动深入践行“网络安全为人民”的使命,毫不动摇地推进国家安全体系构建的关键任务,把维护国家安全贯穿工作的各方面和全过程。山东移动聚焦基础通信网络安全、信息安全以及生产安全等领域,加速构建一张广覆盖、立体化、高效能的安全防护网络。在云计算与网络融合、算力网络一体化发展的趋势下,山东移动持续提升网络运行的安全水平,确保国家与公民的信息安全,全方位支撑各行各业的安全生产,为社会各领域筑就一道坚实的安全防线。
山东移动携手华为完成信令风暴预测预防系统的全国首局试点,为防范信令风暴带来的网络隐患风险提供了坚实基础。山东省作为试点先行者,在全国网络安全领域中的先锋模范作用得到了进一步的肯定和凸显。该系统不仅对提高网络服务质量有着直接贡献,也强化了区域内的网络安全生态,增强了应对突发状况的能力。
山东移动已经规划了后续措施,包括进一步提升网络安全保障水平、强化监测预警体系、深化技术研究与行业合作等,旨在构建更加全面的网络安全防护体系。这不仅是山东移动为国家和地方社会经济健康发展所做出的努力,也是对国家安全和社会稳定的积极贡献,体现了运营商在维护网络安全方面的社会责任。
通过加大安全技术和产品的研发投入、提升服务供给质量,山东移动有望推动网络安全产业的创新发展,为民众带来更安全、更可靠的信息通信环境,进一步提升社会信息化水平与促进数字经济发展。未来,山东移动将进一步为维护国家安全、社会稳定,增进人民福祉做出更大贡献。
*本文刊载于《通信世界》
总第960期 2025年1月25日 第2期