DeepSeek撬动算力市场，摩尔线程谈国产算力芯片如何破局？

作者：包建羽责任编辑：包建羽 2025.02.21 14:24 来源：通信世界全媒体

DeepSeek

算力

摩尔线程

GPU

通信世界网消息（CWW）开源模型逐渐占据主流话语权，接入与适配成为必然选择，DeepSeek为行业增添发展动力的同时，也掀起了一场从底层技术到设施建设乃至体系生态的算力革命。

最直观地，凭借“轻量化训练+高效推理”的特性，DeepSeek不仅大幅降低了大模型开发成本，更对传统以英伟达为首的训练芯片巨头形成直接冲击。在这场技术变局中，国产算力芯片作为算力的根本支撑，亟待探索出一条属于自己的发展之路。

从“训练为王”到“推理称雄”

在AI技术体系中，训练与推理是两大核心环节，训练需要海量数据和超强算力，推理则要求快速响应现实问题，随着AI应用场景的普及，推理算力需求正迅速超越训练端。根据IDC数据，未来几年，推理端的AI服务器占比将持续攀升。预计到2027年，用于推理的工作负载将占据七成以上。

“DeepSeek的核心突破在于算法优化和计算效率提升，这种低算力需求模型对国产芯片的发展是一个重要机遇。”摩尔线程市场生态高级总监吕其恒在接受采访时讲道。

首先，DeepSeek的成功表明，通过模型压缩、稀疏计算、混合精度训练等技术手段降低算力需求，可以在一定程度上弥补硬件性能的不足，为国内芯片提供了软硬件协同设计的新思路，证明了在硬件性能短期内难以赶超的情况下，通过软件层面的创新仍可提升整体计算效能。

其次，DeepSeek在混合精度训练方面的成功，展示了低精度计算在AI训练中的潜力。国内芯片厂商可以借鉴这种模式，优化芯片的计算单元，支持更灵活的精度配置。

据了解，摩尔线程是目前国内唯一能支持包括FP8在内的全精度AI训练的全功能GPU企业。摩尔线程全功能GPU配备了最新一代的Tensor Core，原生支持E5M2和E4M3两种表示方式的FP8数据精度，可以为DeepSeek的模型训练提供国产算力支持。

谈及DeepSeek对国产算力芯片的影响，吕其恒认为，从训练侧来看，Scaling Law规模定律仍然有效，模型迭代会加快，对于国产优质训练算力的需求不会降低；长期看，模型参数规模扩大（如GPT-5）和训练方法革新（如MoE）仍会推动训练算力需求增长。

而从推理侧来看，随着生成式AI应用落地，落地应用（如AIGC、智能体、垂直行业模型）将带来海量碎片化推理需求，市场规模有可能超过训练。

激活“训推一体”，驱动协同增长

目前，DeepSeek凭借算法优化与混合精度训练技术，将大模型训练成本显著降低，一改往日大模型训练“大力出奇迹”的画风。DeepSeek推动AI普惠化的同时，国产厂商也有望借鉴DeepSeek的技术创新经验，在推理侧开拓新蓝海。

以摩尔线程为代表，作为一家专注于全功能GPU设计的企业，其正积极探索与DeepSeek相结合的AI应用与产品。

一方面，摩尔线程的全功能GPU已成功适配DeepSeek-V3和DeepSeek-R1原生671B模型，进一步验证了摩尔线程在软硬件协同优化方面的深厚技术积累；另一方面，基于全功能GPU，摩尔线程与合作伙伴联合打造的多款智算一体机已完成与DeepSeek等主流大模型的深度适配。

例如，摩尔线程与雪浪云联合打造的“软硬件紧耦合”大模型训推一体机——雪浪MindCenter X100，凭借其卓越的性能和灵活的架构，已成功部署DeepSeek-R1-Distill-Qwen推理服务，并在多种中文任务中展现了优异的性能。

“对于摩尔线程来说，DeepSeek的V3和R1进一步验证了我们GPU产品在功能上的前瞻性，特别是对FP8精度的支持和不牺牲算力的异步通信能力。”吕其恒讲道。

随着DeepSeek模型在多个智算中心快速部署，推理算力需求激增，面向推理侧和训练侧的部署调整，吕其恒认为，短期内，国产GPU厂商应保持训练芯片的持续迭代，比如最好支持FP8，确保技术不脱节），同时通过推理芯片快速切入商业化场景。从长期上，应瞄准“训推一体”架构（如摩尔线程MUSA），通过统一计算平台降低客户切换成本，最终在自主生态中实现训练与推理的协同增长。

技术门槛迁移，迎接“多元共存”

在AI芯片行业，“生态兼容性”始终是国产厂商难以跨越的隐形门槛。英伟达凭借CUDA生态构筑的技术护城河，曾让国产GPU在训练场景中举步维艰。然而，DeepSeek开源模型的推出，配合国产芯片厂商的战略协作，正在重塑这一游戏规则。

“长期来看，随着国产替代的推进、算法优化能力的提升，以及行业对供应链安全的重视，将逐步降低单一依赖风险。”吕其恒指出，这一过程需要时间和技术积累，但已是不可逆的趋势，未来的算力底座更可能呈现“多元共存”的形态。

尽管当前国产AI生态仍面临不同厂商技术框架兼容性不足、技术标准碎片化，垂直领域付费模式不甚清晰、商业闭环尚未成熟，行业巨头生态绑定式制约、全球化竞争压力等多重挑战。

在技术与产业的双重考量下，我们可以看到，摩尔线程携手行业伙伴探索构建全国产“算法－芯片－场景”的生态，验证了AI国产自主发展创新的道路是完全可行的。

在技术验证与突破上，摩尔线程接入DeepSeek，验证了其自研全功能GPU的通用性与CUDA兼容性，这表明国产GPU在复杂AI任务中具备强大的支持能力，为国产AI技术的自主可控发展奠定了坚实基础。

在生态协同上，DeepSeek的开源模型与摩尔线程的硬件实践形成国产闭环，将进一步推动国产AI硬件与软件的协同发展。这种协同不仅提升了整体性能，还为未来更多大规模模型的部署提供了技术保障，有助于构建更加完善的国产AI技术生态。

在产业协同与集群效应上，无论是摩尔线程的行业合作，还是其他国产芯片厂商的接入与适配实践，都将吸引更多上下游企业参与到国产AI生态建设中，形成产业集群效应，推动整个国产AI产业的发展。

在开源与普惠化上，DeepSeek的开源模式降低了AI技术的使用门槛，摩尔线程的高效部署使得更多开发者能够基于国产GPU进行AI应用创新。这种开源与普惠化的结合，也将推动AI技术的广泛传播和应用，促进国产AI生态的繁荣。

目前，摩尔线程已经在制造业、工程机械、新能源、教育、金融等多个行业中落地应用，展示了国产GPU在复杂AI任务中的强大支持能力。

吕其恒介绍，未来，摩尔线程将持续深化与开源社区合作，通过技术开放与生态共建，推动国产全功能GPU在AI计算领域的规模化应用，并协同多家生态伙伴形成的强大的生态网络。

结语

DeepSeek的横空出世绝非偶然，产业协同创新更是发展必然。从产业链上游的算力基础，到中游的模型研发和数据训练，再到下游的垂直应用与合作，折射出了中国AI产业从“追赶者”向“定义者”转型的集体野心。摩尔线程的实践证明，当算法创新、硬件突破与生态协作形成合力时，国产算力有能力在市场占据一席之地。深耕技术自主、生态开放以及场景纵深的破局之路，2025年，国产算力芯片大有可为。

通信世界网版权及免责声明:

1、凡本网注明“来源：通信世界全媒体”及标有原创的所有作品，版权均属于通信世界网。未经允许禁止转载、摘编及镜像，违者必究。对于经过授权可以转载我方内容的单位，也必须保持转载文章、图像、音视频的完整性，并完整标注作者信息和本站来源。
2、凡本网注明“来源：XXX（非通信世界网）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的，请在相关作品刊发之日起30日内进行。

发表评论请先登录

发表评论

评价

共0条评论

...

热点文章

...

技术文章

...

会议活动