通信世界网消息(CWW)今日,在第二十四届中国光网络研讨会上,中国电信集团科技委主任、中国光网络研讨会大会主席韦乐平指出,大模型时代将开启新一波“光进铜退”。
在人工智能的浪潮中,大模型技术以其强大的性能和广泛的应用前景,正逐渐成为引领智能时代的新引擎。在韦乐平看来,大语言模型的基本特征有三点。一是大算力、大参数、大数据、大智能。算力规模越大、模型参数越多、高质量数据越多,智能就越高,越能解决复杂的任务和推演出更高水平的结果;行业模型,需要百亿至千亿参数,基础通用大模型,需要千亿至万亿参数,而全球领先的基础通用大模型,则需数万亿至数十万亿级的参数。二是一定的通用性。需具备领域型模型特点,能完成多领域的诸多任务,非单一任务三是神奇的涌现性。当算力、数据和模型参数足够大,训练到一定程度后,能够突然出现预料之外的某种能力,产生逻辑自恰的类人类语言表达,这种能力会达到乃至超过人类某方面的智能。
大模型时代的“涌现”为高速光模块带来了机遇,大模型的崛起催化DC内交换机光模块的速率、数量和成本快速增加。据悉,英伟达1个GH200系统竟使用了3072块800Gbit/s光模块,仅1颗GPU芯片就需要12块800Gbit/s光模块。LightCounting在1年内连续两次调高800G光模块出货量的预测。Omdia也将大模型驱动光模块出货量从今年的400万调高至1200万。韦乐平称,预计3-4年内,基于1600ZR/ZR+标准,240-280G波特率的产品即将问世。韦乐平在会上提出疑问,“”十年内,能否达到400-500G波特率,能不能再往前走,目前在技术上没有看到希望。还需要探索和努力。
谈到大模型时代ODSP进展和趋势。韦乐平称,目前oDSP采用5nm、120G波特率级、QPSK码型能支持400G速率1600公里的超长干线传输。而新一代oDSP将采用3nm、180G波特率级(或240G)、QPSK码型应能支持800G速率数百乃至上千公里的普通长距离干线传输。此外,300G波特率级oDSP技术有望实现,但400G级别尚无技术路径。
韦乐平预测,未来oDSP将呈现三大技术发展趋势。一是在5nm和800G级别,模拟电路消耗了约50%功率,在3nm和1.6G级别一在5nm和800G级别,可消耗约65%功率,将功耗大头的模拟电路从oDSP分离是重要趋势。二是为进一步降低功耗,可能还需根据细分市场分别优化定制设计。三是数字副载波调制(DSCM)不仅增强高波特率信号对色散和滤波的容忍度,还能增强对非线性的容忍度,是未来超高速系统趋势之一。
此外,韦乐平指出,大模型训练导致高速率高密度高成本下的困境,随着基础传输速率攀开至每通道100/200G以上,由于趋肤效应、PCB材料高频损耗、串音干扰等导致PCB板铜箔的损耗和功牦快速上开,减少影响的唯一举措就是减小器件间传输距离,直至完全消除铜连线。此外,随着传输速率持续提升,光模块的成本也在持续上升。在400G速率,交换机光器件成本的占比已超过50%。在更高速率下,其占比将更高。
值得注意的是,大模型训练导致了高速率高密度高成本的困境,随着速率高到100/200G以上,由于趋肤效应,PCB材料高频损耗、串音干扰等导致PCB板铜箔的损耗和功耗快速上升,减小影响的唯一举措就是减小器件间传输距离,直至完全消除铜连线。此外,随着速率持续提升,光模块成本也在持续上升。400G速率交换机光器件成本占比已超过50%,在更高的速率下,占比更高。
因此,韦乐平提出,大模型正在开启新一波“光进铜退”。更好地应对大模型带来的蛮力计算所导致的巨大能耗和成本,“光进铜退”必将从接入网延伸至数据中心乃至服务器、器件或芯片互联直至基本消除电连接。他也提醒到,这一进程不会一蹴而就,随着两者光和电博弈将波折前行,但长远大趋势不会逆转。
不仅如此,大模型对DCN和DCI用光模块也有一定的影响。
DCN方面,首先,网络性能成为提升集群有效算力的关键。大模型训练时,并行计算节点越多,通信效率越重要,网络性能成为集群算力提升的瓶颈。关键技术要求是高带宽、低时延、低功耗。其次,大模型驱使光模块用量的不断提升。随着大模型崛起,DCN交换机光模块数量和速率及成本快速增加。最后,大模型驱使光模块速率的不断提升。800GbE快速崛起,预计2024年出货量超1000万。基于200G/通道的DSP即将商用化。
DCI方面,数据中心互联的时延性能要求决定了集群计算的范围。因为单站点电源、空间等资源受限,最终大模型的训练范围早晚会外溢至园区乃至更远。此外,大模型训练对网络也有一定的影响。
最后谈及大模型时代封装技术,韦乐平称,“原来的封装技术不是很重要,现在看起来,封装技术成为一个关键,关键是功耗。”在他看来目前有三种封装技术选择:光电共封装 CPO、线性直驱LPO、以及线性接收光连接LRO。三种技术各有优缺点,如何选择,还需根据场景而定。