DeepSeek撬动算力市场,摩尔线程谈国产算力芯片如何破局?

作者:包建羽 责任编辑:包建羽 2025.02.21 14:24 来源:通信世界全媒体

通信世界网消息(CWW)开源模型逐渐占据主流话语权,接入与适配成为必然选择,DeepSeek为行业增添发展动力的同时,也掀起了一场从底层技术到设施建设乃至体系生态的算力革命。

最直观地,凭借“轻量化训练+高效推理”的特性,DeepSeek不仅大幅降低了大模型开发成本,更对传统以英伟达为首的训练芯片巨头形成直接冲击。在这场技术变局中,国产算力芯片作为算力的根本支撑,亟待探索出一条属于自己的发展之路。

训练为王推理称雄

在AI技术体系中,训练与推理是两大核心环节,训练需要海量数据和超强算力,推理则要求快速响应现实问题,随着AI应用场景的普及,推理算力需求正迅速超越训练端。根据IDC数据,未来几年,推理端的AI服务器占比将持续攀升。预计到2027年,用于推理的工作负载将占据七成以上。

“DeepSeek的核心突破在于算法优化和计算效率提升,这种低算力需求模型对国产芯片的发展是一个重要机遇。”摩尔线程市场生态高级总监吕其恒在接受采访时讲道。

首先,DeepSeek的成功表明,通过模型压缩、稀疏计算、混合精度训练等技术手段降低算力需求,可以在一定程度上弥补硬件性能的不足,为国内芯片提供了软硬件协同设计的新思路,证明了在硬件性能短期内难以赶超的情况下,通过软件层面的创新仍可提升整体计算效能。

其次,DeepSeek在混合精度训练方面的成功,展示了低精度计算在AI训练中的潜力。国内芯片厂商可以借鉴这种模式,优化芯片的计算单元,支持更灵活的精度配置。

据了解,摩尔线程是目前国内唯一能支持包括FP8在内的全精度AI训练的全功能GPU企业。摩尔线程全功能GPU配备了最新一代的Tensor Core,原生支持E5M2和E4M3两种表示方式的FP8数据精度,可以为DeepSeek的模型训练提供国产算力支持。

谈及DeepSeek对国产算力芯片的影响,吕其恒认为,从训练侧来看,Scaling Law规模定律仍然有效,模型迭代会加快,对于国产优质训练算力的需求不会降低;长期看,模型参数规模扩大(如GPT-5)和训练方法革新(如MoE)仍会推动训练算力需求增长。

而从推理侧来看,随着生成式AI应用落地,落地应用(如AIGC、智能体、垂直行业模型)将带来海量碎片化推理需求,市场规模有可能超过训练。

激活“训推一体”,驱动协同增长

目前,DeepSeek凭借算法优化与混合精度训练技术,将大模型训练成本显著降低,一改往日大模型训练“大力出奇迹”的画风。DeepSeek推动AI普惠化的同时,国产厂商也有望借鉴DeepSeek的技术创新经验,在推理侧开拓新蓝海。

以摩尔线程为代表,作为一家专注于全功能GPU设计的企业,其正积极探索与DeepSeek相结合的AI应用与产品。

一方面,摩尔线程的全功能GPU已成功适配DeepSeek-V3和DeepSeek-R1原生671B模型,进一步验证了摩尔线程在软硬件协同优化方面的深厚技术积累;另一方面,基于全功能GPU,摩尔线程与合作伙伴联合打造的多款智算一体机已完成与DeepSeek等主流大模型的深度适配。

例如,摩尔线程与雪浪云联合打造的“软硬件紧耦合”大模型训推一体机——雪浪MindCenter X100,凭借其卓越的性能和灵活的架构,已成功部署DeepSeek-R1-Distill-Qwen推理服务,并在多种中文任务中展现了优异的性能。

“对于摩尔线程来说,DeepSeek的V3和R1进一步验证了我们GPU产品在功能上的前瞻性,特别是对FP8精度的支持和不牺牲算力的异步通信能力。”吕其恒讲道。

随着DeepSeek模型在多个智算中心快速部署,推理算力需求激增,面向推理侧和训练侧的部署调整,吕其恒认为,短期内,国产GPU厂商应保持训练芯片的持续迭代,比如最好支持FP8,确保技术不脱节),同时通过推理芯片快速切入商业化场景。从长期上,应瞄准“训推一体”架构(如摩尔线程MUSA),通过统一计算平台降低客户切换成本,最终在自主生态中实现训练与推理的协同增长。

技术门槛迁移,迎接“多元共存”

在AI芯片行业,“生态兼容性”始终是国产厂商难以跨越的隐形门槛。英伟达凭借CUDA生态构筑的技术护城河,曾让国产GPU在训练场景中举步维艰。然而,DeepSeek开源模型的推出,配合国产芯片厂商的战略协作,正在重塑这一游戏规则。

“长期来看,随着国产替代的推进、算法优化能力的提升,以及行业对供应链安全的重视,将逐步降低单一依赖风险。”吕其恒指出,这一过程需要时间和技术积累,但已是不可逆的趋势,未来的算力底座更可能呈现“多元共存”的形态。

尽管当前国产AI生态仍面临不同厂商技术框架兼容性不足、技术标准碎片化,垂直领域付费模式不甚清晰、商业闭环尚未成熟,行业巨头生态绑定式制约、全球化竞争压力等多重挑战。

在技术与产业的双重考量下,我们可以看到,摩尔线程携手行业伙伴探索构建全国产“算法-芯片-场景”的生态,验证了AI国产自主发展创新的道路是完全可行的。

在技术验证与突破上,摩尔线程接入DeepSeek,验证了其自研全功能GPU的通用性与CUDA兼容性,这表明国产GPU在复杂AI任务中具备强大的支持能力,为国产AI技术的自主可控发展奠定了坚实基础。

在生态协同上,DeepSeek的开源模型与摩尔线程的硬件实践形成国产闭环,将进一步推动国产AI硬件与软件的协同发展。这种协同不仅提升了整体性能,还为未来更多大规模模型的部署提供了技术保障,有助于构建更加完善的国产AI技术生态。

在产业协同与集群效应上,无论是摩尔线程的行业合作,还是其他国产芯片厂商的接入与适配实践,都将吸引更多上下游企业参与到国产AI生态建设中,形成产业集群效应,推动整个国产AI产业的发展。

在开源与普惠化上,DeepSeek的开源模式降低了AI技术的使用门槛,摩尔线程的高效部署使得更多开发者能够基于国产GPU进行AI应用创新。这种开源与普惠化的结合,也将推动AI技术的广泛传播和应用,促进国产AI生态的繁荣。

目前,摩尔线程已经在制造业、工程机械、新能源、教育、金融等多个行业中落地应用,展示了国产GPU在复杂AI任务中的强大支持能力。

吕其恒介绍,未来,摩尔线程将持续深化与开源社区合作,通过技术开放与生态共建,推动国产全功能GPU在AI计算领域的规模化应用,并协同多家生态伙伴形成的强大的生态网络。

结语

DeepSeek的横空出世绝非偶然,产业协同创新更是发展必然。从产业链上游的算力基础,到中游的模型研发和数据训练,再到下游的垂直应用与合作,折射出了中国AI产业从“追赶者”向“定义者”转型的集体野心。摩尔线程的实践证明,当算法创新、硬件突破与生态协作形成合力时,国产算力有能力在市场占据一席之地。深耕技术自主、生态开放以及场景纵深的破局之路,2025年,国产算力芯片大有可为。

通信世界网版权及免责声明:
1、凡本网注明“来源:通信世界全媒体”及标有原创的所有作品,版权均属于通信世界网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、凡本网注明“来源:XXX(非通信世界网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。
发表评论请先登录
...
热点文章
    暂无内容