通信世界网消息(CWW)9月19日,在2024年华为全联接大会上,华为副董事长、轮值董事长徐直军发表了题为《拥抱全面智能化时代》的演讲。在算力方面,他深入阐述了算力作为智能化关键基础的重要性,并从长远发展角度对当前算力发展提出了三点想法。
徐直军指出,智能化进程的长远发展离不开算力的持续支撑,但唯有基于实际可获得的芯片制造工艺,才能构建出长期可持续的算力体系。他强调,华为将充分利用人工智能带来的变革机遇,通过计算、存储和网络技术的协同创新,开创计算架构,打造“超节点+集群”系统算力解决方案,以满足日益增长的算力需求。
在谈到当前大模型技术突破对智能化进程的加速作用时,徐直军表示:“大模型的技术突破大大加速了智能化的进程,一段时间以来,各行各业几乎言必称大模型,纷纷建设AI算力,纷纷训练大模型。”但他也直言不讳地指出,虽然这对华为这样的算力提供商是利好的,但从长远发展角度考虑,只有客户的持续成功,才有华为的持续发展。因此,他提出了三点想法。
一是AI算力建设的理性审视。徐直军指出,并非所有企业都需盲目追求大规模AI算力建设。AI服务器的特殊需求,如高供电、强散热等,以及对数据中心环境的严苛要求,使得企业在规划AI算力时需谨慎评估。随着大模型的不断演进,AI算力需求急剧增长且变化迅速,企业若自建算力,可能面临资源闲置或不足的两难境地。此外,AI硬件产品的快速迭代、资源调度的复杂性以及运营维护的高难度,均要求企业根据自身实际情况,灵活选择适合的AI算力获取方式,如利用公有云服务等,以实现资源的优化配置与高效利用。
二是基础大模型训练的审慎考量。徐直军强调,训练基础大模型并非企业AI战略的必然选择。首先,数据是训练大模型的核心,而获取并处理足够的高质量数据对于企业而言是一大挑战,其成本高昂且难度不小。其次,大模型的训练与优化过程复杂且耗时,可能严重影响企业核心业务的推进。再者,专业人才的匮乏也是制约企业自主训练大模型的重要因素。因此,企业应权衡利弊,聚焦自身核心业务,考虑是否通过合作或购买服务等方式获取所需的大模型能力,而非盲目投入资源进行自主训练。
三是模型选择与应用的精准定位。徐直军进一步指出,不是所有的应用都要追求“大”模型。华为盘古的实践表明,根据具体业务需求选择合适的模型规模至关重要。例如,十亿参数模型已能满足诸多科学计算与预测决策场景的需求;而百亿参数模型则适用于NLP、CV等多模态特定领域;对于更为复杂的任务,则可考虑采用千亿参数模型。企业应根据自身业务特点与需求,灵活选择并组合多种模型,以最优化的方式解决问题并创造价值。