大模型开闭源之争 本质是商业化的争夺

作者:ICT行业资深分析师 金峰 责任编辑:包建羽 2024.07.29 16:10 来源:通信世界全媒体

通信世界网消息(CWW)大模型从发展之初,即存在开源与闭源两条路线,孰优孰劣,也处于持续争论之中。2024年7月,在“2024世界人工智能大会”上,众多业内领军人物对大模型开闭源表达了针锋相对的观点。

例如,百度创始人李彦宏站在闭源“阵营”,而百川的王小川、360的周鸿祎、猎豹的傅盛则持相反观点,双方均认为对方的路线是一种“智商税”。

历史规律:路线差异,结果一致

对于大模型开源闭源的孰优孰劣,以及未来发展前景如何,可以从软件产业开源与闭源的发展历史中,寻找到相应的发展规律。

首先,开源与闭源是对软件产品开发模式和商业模式不同的路径探索。具体对比如表1所示。

image.png

其次,开源与闭源的结果殊途同归。闭源一直有之;而开源,则起步于20世纪70年代的“自由软件运动”,后于1985年成立自由软件基金会,至20世纪90年代,完全的“自由”逐步被规范化、商业化的“开源”所取代,并在1998年成立了开放源代码促进会。从长期效果来看,两者并存并且各自推出了可相互媲美的产品,例如操作系统领域的Windows和Linux,数据库领域的Oracle与MySQL等。对于复杂的大型软件产品而言,即便前期是由软件爱好者共同开发出原始版本(如Linux),但最终也是由大企业负责后期商业版本的推进。

最后,开源与闭源的过程,体现了适用性的差异。一是产品类型的适用性问题。总体而言,开源适合通用型的工具产品,闭源则更适用于ERP等涉及深层次行业经验的产品(相关经验一般积累在企业的知识库中)。二是产品规模的适用性问题。总体而言,开源适合小规模的软件产品,闭源则更适合体量较大的软件产品,一些操作系统、数据库等在后期商业化进程中,亦偏向闭源经营模式。三是经营企业适用性。行业中绝对领先的企业基本采用闭源模式,以保证市场控制;而行业挑战者则偏好开源,可以快速打造产品和生态。

大模型现状:大企业主导开闭源之争,商业路线是核心

2022年11月,GPT-3.5的发布推动了大模型产业进入爆发性增长期,“百模大战”快速向“千模大战”迈进。在此过程中,开源与闭源路线一直是争议的焦点。

值得注意的是,大模型的开源与早期软件产业的开源有着显著不同。软件开源遵循“爱好者发布原型——群体性打磨——大企业打造发布版——代码开源而商业闭源——爱好者成为生态助力”;而大模型开源,则直接跳过了前两个阶段,直接由大企业发布代码开源产品,这导致了两个结果。

第一,产品质量取决于企业能力,与开闭源无关。若以闭源的ChatGPT为标杆,则闭源的产品质量一直保持领先。2023年下半年,以Meta的Llama3为代表的多个开源模型发布,在评测中有不少已超过GPT-3.5的能力,甚至接近GPT-4的能力;但2024年闭源Sora发布后,上述差距又被进一步拉大。

业内人士认为,产品质量的差距与是否开源基本无关,而取决于研发团队的能力,即团队可以调配的资金、算力和数据。在大企业对大模型代码开源后,开源社区对产品质量提升的幅度不足5%,基本可以忽略不计。一方面,大企业发布的产品完备性较高;另一方面,训练大模型成本高昂,已经不是开源社区内中小主体能够承担得起的,尤其是大规模参数模型训练。

第二,开闭源之争,实际是商业化的争夺。从历史经验可知,开源或者闭源,是不同企业对最适合自身的商业化路径选择。选择将大模型闭源的有OpenAI的ChatGPT、百度的文心一言、华为的盘古、商汤的日日新等,其共同特征是企业在各自的领域中均处于领先地位,闭源后拥有更好的自我保护能力,并可形成许可证销售等商业形态。而选择开源的Meta、谷歌、百川、360、阿里等企业,均是行业的追赶者,它们希望借助“Linux模式”,聚合生态力量,在商业上实现对领先者的赶超。至于处在“长尾”中的大模型厂商,它们的产品大多基于开源大模型而开发,因此亦为开源的拥护者。

大模型未来:“两条腿走路”,加速商业落地

大模型产业发展至今,进一步提升大模型质量固然重要,但更重要的是尽快实现商业落地。为此,2024年5月百度、火山等国内大模型厂商开启了“价格战”;同时,大模型厂商也形成共识,即实现大模型在行业场景中落地。商业化成为大模型行业的重心,各个企业开源或闭源的路线选择亦是立足于企业的资源禀赋,服务于商业化路线,尤其是推动行业应用落地。着眼于未来发展,大模型行业将采用开源与闭源并存的“两条腿走路”发展策略,具体包括三种模式。

一是侧重闭源模式,但会叠加开源生态。上文提及在产业中具有显著领先优势的企业,如OpenAI、百度、华为等,仍然对各自的核心大模型产品采用闭源发展的模式,以实现绝对掌控权。但为了促进应用场景的落地,它们将叠加开源生态,其中包括插件市场的生态,如PPT制作、行业数据库接入等;以及衍生训练的大模型生态,如基于盘古大模型的行业大模型、场景大模型等。

二是侧重开源模式,但要打造基座产品。上文所提及的行业跟随者,如Meta、阿里、百川、360、猎豹等,是开源模式的拥护者。它们需要借助开源社区,提升基础大模型产品质量,使开发者直接使用谷歌、Meta等厂商的大模型进行训练,以及优化算法;同时需要实现产业生态的构建,在此过程中,将优先打造可供使用的“基座型”产品。

三是闭源与开源并存模式,选择适合的模型进行开源。其共同的特征是在较大模型上选择闭源,在较小模型上选择开源。如谷歌的“Gemma(开)+Gemini(闭)”组合、科大讯飞的“星火开源(开)+讯飞星火(闭)”组合、商汤科技的“书生(开)+日日新(闭)”组合等。开闭源的产品组合在强化对核心产品控制力的同时,也促进了生态发展。实际上,大参数模型由于训练成本较高,开源生态贡献较为有限。

从大模型整体发展来看,业界当前所聚焦的大模型算法开源或闭源,仅仅是一个方面,而训练数据的开源或闭源,也同样需要关注。笔者认为,未来的数据集仍将是以开源与闭源的方式并存,预计其中开源数据集将占据市场80%的数据量,主要解决大模型“可训练”的问题,并基于此形成通用大模型底座;而闭源数据集将占据市场20%的数据量,主要解决大模型“训练好”的问题,并基于此形成差异化大模型产品,尤其是面向行业或场景的大模型,这才是大模型厂商竞争的焦点。

*本文刊载于《通信世界》

总第948期 2024年7月25日 第14期

通信世界网版权及免责声明:
1、凡本网注明“来源:通信世界全媒体”及标有原创的所有作品,版权均属于通信世界网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、凡本网注明“来源:XXX(非通信世界网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。
发表评论请先登录
...
热点文章
    暂无内容