通信世界网消息(CWW)5G网络的规模部署推动移动网络架构和能力实现了跃迁升级,也带动了基础通信业务的再创新。中国移动已经建成覆盖全国、技术先进、品质优良的5G SA(5G Stand Alone)网络,并实现了VoNR(Voice over New Radio)业务的全面商用,可为用户提供720P高清视频通话业务。
为了开启全新的多媒体、全交互实时通信时代,实现从视听通信到全感通信质的飞跃,中国移动基于3GPP的IMS(IP Multimedia Subsystem)数据通道技术标准,提出了全新的“VoNR+”技术体系架构,即在VoNR网络上搭载新的数据通道及智能媒体处理能力,为用户提供更为丰富的交互式超清智话业务体验;同时,通过引入更加灵活的开放架构,便于第三方通话类应用便捷入驻,打造VoNR+话音开放平台,助力构建多维度5G新通话生态。
VoNR+网络关键技术
移动通信运营商4G VoLTE(Voice over LTE)业务已实现全网商用,5G通信诉求也从语音通信逐步过渡到视频通信。VoNR用户对视频通话提出了更高要求,除高质量音视频通信外,还包括更加智能、更具交互性的服务体验。5G VoNR+网络基于VoLTE/VoNR网络升级,通过引入VoNR+能力网元、VoNR+智能媒体面人工智能(Artificial Intelligence,AI)处理及运营管理功能,打造了全新的视频通话基础架构(如图1所示),并将催生5G通话的新业态新模式。
图1 VoNR+话音网基于数据通道和智能媒体面催生新业态
VoNR+架构构建了新一代实时通信基础设施,具备四大核心技术能力。
实时交互能力
VoNR+借助IMS数据通道(IMS Data Channel)技术,在语音通道、视频通道之外,增加了一条数据通道(如图2所示)。VoNR+网络侧针对音视频通道业务进行分层编码和传输,并提供不同的5QI(5G QoS Identifier)进行QoS保障;针对数据通道业务,识别不同的数据包并以更细粒度实施QoS控制,引入新的QoS参数以支持触觉数据或传感器数据传输。数据通道可伴随通话传递位置、图片、文字,甚至是听觉、视觉、触觉、动觉、环境信息等更丰富的交互信息,将通话从单一话音升级为多媒体形式。
图2 基于IMS Data Channel的实时交互技术
媒体智能AI处理能力
VoNR+中的媒体计算处理业务包括实时话音翻译及AR远程标注等对音视频进行处理的业务,网络侧算力资源需要对媒体进行分布式处理,如图3所示,通过将媒体算力节点与IMS数据面核心网元SBC(Session Border Controller)进行融合,实现媒体面的算网一体。这需要IMS网络实现算力资源调度及实时处理,因此基于IMS的媒体智能AI处理将是未来VoNR+业务体验保障的重要技术,可提供音视频差异化服务,比如通过人脸识别、手势识别以及实时翻译等AI处理能力设计新的业务产品。
图3 VoNR+媒体智能AI处理技术
基于微服务架构的VoNR+网络云
VoNR+作为打造新通话生态的网络核心环节,其基于微服务框架和统一公有云服务平台,面向CHBN市场应用集成创新能力,通过二次开发实现应用新模式,打造新通话业务创新引擎;VoNR+网络架构在设计之初借鉴了业界成熟的SOA和微服务架构的理念,基于该架构,每个VoNR+网络相关网元均由若干细粒度的服务组成,各网元的基础处理功能被封装为独立的原子化服务能力,该能力可以实现独立的功能部署、能力升级以及灰度发布,这使得未来VoNR+网络可以实现快速的功能引入和能力的敏捷迭代。VoNR+各网元的原子化服务可通过API形式进行灵活调用,任何授信的网元均可以通过API实现能力的按需调用。
终端小程序业务生成技术
VoNR+终端提供了一个全新应用框架,通过原生通话应用和新通话小程序结合的方式,为企业、开发者构建了一个全新的5G新通话生态。如图4所示,运营商搭建一个开放的应用平台,企业和开发者则以提供小程序的方式,共建合作共赢的环境。基于Web技术及JavaScript脚本可以实现应用及网络自定义的灵活界面显示,减少对端侧繁琐的定制诉求;同时,终端应支持将IMS Data Channel向应用层开放调用接口,使能IMS Data Channel成为新的行业应用入口,丰富基于运营商音视频的行业应用生态。
图4 VoNR+终端侧小程序业务生成框架
VoNR+网络创新进展及趋势
中国移动已启动VoNR+新通话业务试点,在兼顾不同终端能力的基础上,最大化用户业务体验。VoNR+网络能力将为个人市场(to C)和行业市场(to B)带来更大的业务创新空间。目前个人通信市场已日趋稳定,行业市场是新的“蓝海”。行业类业务需求巨大,基于VoNR+架构可以提供定制化的特色服务。
VoNR+to C创新场景
目前在to C市场已经明确了一些个人业务场景,如超清视话、AI趣味通话以及智能翻译等。对运营商而言,to C市场的重要发展方向是提供差异化服务,实现“一号一个性”。在VoNR+商业落地方面,为了尽快推向市场,中国移动在终端尚未具备数据通道能力的情况下,积极试点智能翻译以及趣味通话等业务,未来将结合XR和AI等技术进一步增加用户黏性。
l VoNR+智能翻译
智能翻译业务即在通话过程中,用户将通话方的话音转写成文字,并以字幕形式实时叠加到视频上,呈现出来;同时支持识别话音的语言类型,可按照用户设置的目标语言对通话内容进行翻译,并将翻译后的文字以字幕形式实时叠加到视频上。目前VoNR+智能翻译业务可支持普通话翻译为英语、英语翻译为普通话,支持在同一句话中中英文混合使用。
l VoNR+趣味通话
基于VoNR+视频通话能力,中国移动结合音视频识别与合成技术,实现了在通话过程中背景替换、虚拟头像替换、语音“表情雨”和手势动效等功能,可在亲情通话、娱乐沟通场景下为用户提供视频通话互动新体验。用户在视频通话前可预设想要替换的虚拟头像,通话中对方看到的是替换后的虚拟头像。此外,VoNR+趣味通话还支持虚拟头像面部和肢体“跟随”,可随时抓取使用者的脸部表情并复制到虚拟形象上。在视频通话过程中语音出现特定词语,双方视频均可叠加这一特定词语所对应的“表情雨”动效,如一方用户在视频通话中说“生日快乐”,双方视频均可呈现“蛋糕雨”动效。视频通话中用户做出特定动作,双方视频均可叠加该动作对应的动效,如一方用户在视频通话中“比心”,双方均可从视频中看到“心形泡泡”动效。
VoNR+to B创新场景
在VoNR+to B市场,运营商可助力实现数字化商业闭环,使能千行百业。应将通话能力延伸到所有行业类APP,典型场景包括可视菜单、远程指导等,并联合PC端共同开展行业应用创新。
l VoNR+智能客服
在用户拨打客服电话时,智能客服系统通过视频通话界面向用户展示视频菜单,用户通过点击拨号盘按键选择所需服务。该系统可实现多个服务菜单视频化显示,减少用户等待播报音时间,支持动态卡片与语音播报相结合,向用户展示其话费及流量消费情况,助力运营商完成基础类业务办理。系统支持“看”视频、“说”诉求,用户可通过智能语音对话申办所需服务。系统以统一客服形象为用户提供通话服务,减少客服人员出镜压力,提升用户感知。
l VoNR+远程指导
当用户接通视频呼叫后,开启共享屏幕功能,通过手机后置摄像头将家中的接口和设备情况共享给装维工程师;装维工程师在屏幕上进行标记,终端通过标记工具在屏幕共享或双方视频通话屏幕上进行涂鸦标记,该标记可针对视频画面中物体进行跟踪,即画面移动时,标记跟随目标同步移动,从而远程指导用户自行完成设备的安装和配置,以及故障的定位和恢复。AR远程指导业务通过视频通话叠加AR标注功能赋能行业用户提升服务效率。
VoNR+打造VaaP创新生态
未来基础实时通信业务将由运营商、用户以及第三方合作伙伴共同定义。VoNR+架构通过构建通信业务能力底座,实现灵活、开放的服务调用,将赋能内外部开发者以及行业用户提供的应用。运营商应积极打造VaaP(Voice as a Platform,话音即平台),基于原生终端,真正把行业生态丰富起来,设计和开发面向个人和行业的新型应用;打造原生VoNR+话音应用商城,构建新的产业生态,从业务需求侧拉动VoNR+产业链成熟,共同繁荣全新的实时通信业务生态。图5为基于VoNR+体系的VaaP平台架构,通过该架构可以灵活实现业务生态创新。
图5 基于VoNR+体系的VaaP平台架构
VoNR+实时通信基础层可提供传统音视频呼叫路由、呼叫控制、媒体控制及协议适配等。VoNR+实时通信基础层通过Restful接口向能力层提供原子API,简化网络拓扑,提升网络灵活度。
VoNR+实时通信能力层作为新通话的业务中台,在基础音视频之外,通过IMS数据通道提供实时交互、实时共享及远程控制能力。新通话实现了实时交互,将用户感官体验从“听和看”延伸到“触摸及对远端的操作”。
VoNR+实时通信增值应用层通过开放业务能力,实现运营商网络价值最大化,需要引入更多行业伙伴,具备更灵活的应用使能。中国移动提供可编程的管理平台,通过编排引擎、场景化引擎、资源管理能力等实现即插即用,动态加载能力,快速构建生态,支持更多垂直行业使用运营商音视频应用。同时,作为业务应用的统一管理门户,VaaP平台向上支撑多种应用形态,如运营商创新应用、第三方应用及行业应用,并支持应用的接入、管理、维护及安全。
VoNR+网络的平台化、能力化、开放化将为用户带来全新的交互式体验,并吸引更多的企业入驻,进一步丰富行业生态。
总结
5G VoNR+网络对基础通信进行了重新定义,也必将衍生出更为丰富多彩的创新应用。在个人市场和行业市场共同推进的过程中,运营商应不断收集各行业的个性化需求,为用户提供定制化的行业特色服务。5G大规模商用及VoNR的进一步普及将推动话音业务演进到VoNR+。
VoNR+是基础通信迈向未来全息沉浸式交互通信的核心突破口,后续将通过引入算力网络等技术,不断将VoNR+的触角延伸到沉浸式、交互式和拟真模式,让用户感受身临其境的体验,并将成为未来元宇宙(Metaverse)的基础业务能力——通过全感通信,推动现实世界社交关系链在数字世界发生转移和重组,最终实现基础通信业务的颠覆式突破,形成一个安全有序的元宇宙空间。