通信世界网消息(CWW)大模型开始“卷”起来了。
去年年底,ChatGPT往喧嚣已久却未有波澜的AI“湖面”投掷了一枚“石头”,仅用2个月时间就收获了1亿用户。
当学生用其写论文、程序员让其辅助生成代码,甚至作为小编的我都借助ChatGPT起标题时,AI大模型如绵绵细雨无声地融入了我们的日常生活。
一石激起千层浪
“一石激起千层浪。”忽然间,国内的大模型如雨后春笋般兴旺起来。当3月份办公室还在“马冬梅”般讨论着百度的大模型究竟是“文言一心”还是“文心一言”时,4月份阿里巴巴的“通义千问”,5月份科大讯飞的“星火认知”、中国科学院的“紫东太初2.0”又席卷而来。
近日,在中国联通官宣了“鸿湖”大模型后,中国电信也声称将要发布 “TeleChat”大模型,中国移动的“九天”1+N大模型也在“蠢蠢欲动”。连运营商都开始进军大模型了,难道说大模型赛道真的成为互联网领域的“兵家必争之地”了吗?
今日,华为也开始发布了盘古大模型3.0。尽管业界大模型层出不穷,但从注册“盘古”“PANGU”商标专利,到爆料又辟谣盘古大模型称“盘谷Chat”,华为大模型的一举一动仍是受到了业界的关注。
其实,华为从2020年就开始立项大模型研究,在2021年4月也就是前两年的HDC大会上,华为就发布了盘古NLP大模型1.0和盘古视觉大模型。当时,时任华为云CEO的余承东还给予了“华为云盘古大模型是一款在AI产业界非常、非常、非常震撼的产品”重要事情说三遍的称赞。
2021年的盘古NLP大模型,不仅是业内首个千亿参数的中文大模型,而且在预训练阶段学习了超过40TB行业文本数据和400万小时的行业语音数据,具有1100亿参数。在大模型中,参数占有重要的分量。所谓的AI大模型就是将海量数据导入具有亿量级参数的模型中,机器通过完成类似“完形填空”的任务后,最终被训练成具有逻辑推理和分析能力的人工智能。目前大模型参数均在千万亿级别,GPT-3拥有1750亿参数(即175B)。而后,在2021年5月,最大版本参数量达2000亿的“鹏程·盘古”大模型也重磅亮相,2021年的盘古大模型着实称得上“厚积薄发”。
同时,2021年的盘古视觉(CV)大模型也是一个超30亿参数的CV大模型。在预训练时就输入了10亿级图像,能够同时满足底层图像处理与高层语义的理解需求。
此后,华为又相继推出了盘古科学计算大模型、用于药物研发细分场景的大模型、盘古矿山大模型、盘古气象大模型、盘古海浪大模型、盘古金融OCR大模型等。
就在华为正式发布盘古大模型3.0的前一天,又一个重磅的新闻刷屏——华为云盘古气象大模型研究成果在《Nature》正刊发表。据了解,此模型是首个精度超过传统数值预报方法的AI模型,速度相比传统数值预报提速10000倍以上。这篇论文是近年来中国科技公司作为署名单位发表的《自然》正刊论文,《Nature》审稿人也对该成果给予高度评价。这一喜报又为盘古大模型3.0的发布平添了一份期待。
千呼万唤始出来
“千呼万唤始出来”。今日,华为常务董事、华为云CEO张平安正式发布了华为盘古大模型3.0。面对大模型“神仙打架”的现状,他谈道:“自OpenAI发布ChatGPT以来,各种大模型层出不穷,百家齐放。据不完全统计,全球已发布数百个大模型,仅在中国就发布了80多个。有些大模型会写诗、会作画。但华为盘古大模型不作诗、只做事,因为它要深入到各行各业中去,赋能各行各业创造价值。”
华为对应基础大模型、行业大模型和细分场景大模型分为L0、L1和L2层。据张平安介绍,盘古大模型3.0是一个面向行业的大模型系列,包括“5+N+X”三层架构,其中,“5”指的是L0层的自然语言、视觉、多模态、预测、科学计算这5个基础大模型;“N”是指L1层的N个行业大模型,华为云既可以提供使用行业公开数据训练的行业通用大模型,包括政务,金融,制造,矿山,气象等大模型。也可以基于行业客户的自有数据,在盘古大模型的L0和L1层上,为客户训练自己的专有大模型;“X”则表示L2层为客户提供了更多细化场景的模型,提供无限“X”的可能性,L2更加专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景,为客户提供“开箱即用”的模型服务。
值得一提的是,盘古大模型采用完全的分层解耦设计,可以快速适配、快速满足行业的多变需求。客户既可以为自己的大模型加载独立的数据集,也可以单独升级基础模型,也可以单独升级能力集。在L0和L1大模型的基础上,华为云还为客户提供了大模型行业开发套件,通过对客户自有数据的二次训练,客户就可以拥有自己的专属行业大模型。同时,根据客户不同的数据安全与合规诉求,盘古大模型还提供了公用云、大模型云专区、混合云多样化的部署形态。
目前,盘古大模型已在金融、金融、制造、医药研发、煤矿、铁路等诸多行业发挥着巨大价值。在政务领域,华为云携手深圳市福田区政务服务数据管理局,上线了基于盘古政务大模型的福田政务智慧助手小福,能够精准理解民众咨询意图,改变传统的一网通办模式,把老百姓的话语转化为政府办事的语言,让城市更有爱;在煤矿领域,盘古矿山大模型已经在全国8个矿井规模使用,一个大模型可以覆盖煤矿的采、掘、机、运、通、洗选等业务流程下的1000多个细分场景,让更多的煤矿工人能够在地面上作业,不仅能让煤矿工人的工作环境更加舒适,而且可以极大地减少安全事故;在药物研发领域,原来一款新药研发平均需要10年时间、花费10亿美金。盘古药物分子大模型助力西安交通大学第一附属医院刘冰教授团队发现全球40年来首个新靶点、新类别的抗生素,并将先导药物研发周期缩短至1个月、研发成本降低70%……
“盘古为行业而生,就要为行业着想,更好地服务千行百业的客户。”张平安表示,盘古大模型要让每个行业、每个企业、每个人都拥有自己的专家助手,让工作更高效更轻松。我们始终坚持AI for Industries的战略,在深耕行业的道路上不断前行。我坚信大模型将重塑千行百业,而每一个开发者,都将是改变世界的英雄。
结语
中国的古代传说中,盘古通过“开天辟地”让混沌的宇宙焕发生机。希望,华为的盘古大模型也能在人工智能的潮流中带给行业更智能化、更光明的未来,创造“新宇宙”!