通信世界网消息(CWW)近日,由北京大学、北京市昌平区人民政府、北京智源人工智能研究院主办的“北京论坛(2023)新工科专题论坛——新一代人工智能前沿”主题论坛在北京召开,来自国内外人工智能领域领军人物与专家学者200余人与会。论坛聚焦智力时代大模型技术,纵论人工智能对经济、社会、科技、教育等领域的深刻影响,展望未来发展前景。中国移动集团级首席科学家冯俊兰受邀在论坛做《体系化人工智能》报告。
冯俊兰博士基于中国移动九天人工智能的十年成果和经验,畅谈了人工智能产业发展的主要矛盾、演进路线和解决方案。她认为,人工智能产业发展的主要矛盾是日趋泛在的智能化需求和智能化技术赋能成本高之间的矛盾,产业规模化发展的公式是研发成本远小于业务方收益。
冯俊兰博士指出,在小模型时代,人工智能走向规模化应用的核心点是支撑环境适宜、可达的共性AI能力、平台化和业务本身规模化。中国移动历经十年耕耘,打磨出完善的九天人工智能产品体系,规模化赋能智能化业务需求。
来到大模型时代,大模型具备三大优势,即强理解能力、强生成能力和强信息集成能力,但同时也面临可控性、确定性和融合性的挑战。冯俊兰博士认为,复杂系统的智能化体系需要解决两大问题:大而不稳、多而不合。针对大而不稳的问题,中国移动打造通用智能底座,构建适用于泛场景的自主可控通用基础大模型“九天·众擎基座大模型”,具备供给侧增强、持续训练和异构软硬件灵活部署三大特色;在其基础上聚焦供给侧,加快构建行业大模型,包括九天·客服大模型、九天·海算政务大模型、九天·网络大模型等,三年落地了3700多个应用。针对多而不合的问题,冯俊兰博士认为,应在满足计算、传输、安全、可控性等多个约束条件的前提下,组合使用多个模型的能力,包括基础大模型、行业大模型和面向特定任务的小模型等。对此,中国移动提出了体系化人工智能(Holistic AI,HAI)思想,通过体系化人工智能核心技术引擎,实现算力、网络、人工智能能力全局统一调度和开放服务,从而构建了新型人工智能服务模式。
报告中,冯俊兰博士向与会学者详细介绍了中国移动在体系化人工智能原子化、端到端优化和基于大模型的调度体系方面所取得的学术成果和应用实践探索。
在原子化方面,为解决小型机构或个人的成本问题,体系化AI原子模型需符合五大原则,即重用度高、输入输出清晰,功能清晰、不过于细小导致模型协同成本高于计算成本、适合于独立攻关、与基础模型能力互补。原子化方法包括:模型解耦成子网络,记忆单元和推理单元分离,派生时按领域分离、神经元特征分解和模型蒸馏等。目前,中国移动体系化AI已在语音、图像、NLP和网络智能化等领域提供了丰富的AI原子能力库和编排工具,通过拖拽的方式即可实现多个原子能力的编排组合,快速生成新应用。
端到端优化方面,当前主要面临接口复杂、参数量和内存消耗大、端到端闭环数据稀疏、搜索空间巨大等组合学习方面的挑战。针对数据稀疏、参数量大的问题,中国移动分别提出了元辅助学习和级联多任务自适应学习等创新技术。在闭环优化方面,业界已有多种白盒模型的联合优化方法,中国移动提出了Holistic Neural Network(Holi-NN),提出黑盒模型联合优化的创新思路,并在语音+语言、视觉+语言开展技术实践。
基于大模型的调度方面,中国移动打造了Holistic OS,可以完成任务概要、任务分解、原子化模型探索与调度、任务反馈与经验积累一系列闭环工作;原创提出能量模型,用于在开放环境下动态测量评估模型的可靠性,保证人工智能系统的可控可靠、透明可释、隐私保护、明确责任和多元包容。