通信世界网消息(CWW)开源模型逐渐占据主流话语权,接入与适配成为必然选择,DeepSeek为行业增添发展动力的同时,也掀起了一场从底层技术到设施建设乃至体系生态的算力革命。
最直观地,凭借“轻量化训练+高效推理”的特性,DeepSeek不仅大幅降低了大模型开发成本,更对传统以英伟达为首的训练芯片巨头形成直接冲击。在这场技术变局中,国产算力芯片作为算力的根本支撑,亟待探索出一条属于自己的发展之路。
从“训练为王”到“推理称雄”
在AI技术体系中,训练与推理是两大核心环节,训练需要海量数据和超强算力,推理则要求快速响应现实问题,随着AI应用场景的普及,推理算力需求正迅速超越训练端。根据IDC数据,未来几年,推理端的AI服务器占比将持续攀升。预计到2027年,用于推理的工作负载将占据七成以上。
“DeepSeek的核心突破在于算法优化和计算效率提升,这种低算力需求模型对国产芯片的发展是一个重要机遇。”摩尔线程市场生态高级总监吕其恒在接受采访时讲道。
首先,DeepSeek的成功表明,通过模型压缩、稀疏计算、混合精度训练等技术手段降低算力需求,可以在一定程度上弥补硬件性能的不足,为国内芯片提供了软硬件协同设计的新思路,证明了在硬件性能短期内难以赶超的情况下,通过软件层面的创新仍可提升整体计算效能。
其次,DeepSeek在混合精度训练方面的成功,展示了低精度计算在AI训练中的潜力。国内芯片厂商可以借鉴这种模式,优化芯片的计算单元,支持更灵活的精度配置。
据了解,摩尔线程是目前国内唯一能支持包括FP8在内的全精度AI训练的全功能GPU企业。摩尔线程全功能GPU配备了最新一代的Tensor Core,原生支持E5M2和E4M3两种表示方式的FP8数据精度,可以为DeepSeek的模型训练提供国产算力支持。
谈及DeepSeek对国产算力芯片的影响,吕其恒认为,从训练侧来看,Scaling Law规模定律仍然有效,模型迭代会加快,对于国产优质训练算力的需求不会降低;长期看,模型参数规模扩大(如GPT-5)和训练方法革新(如MoE)仍会推动训练算力需求增长。
而从推理侧来看,随着生成式AI应用落地,落地应用(如AIGC、智能体、垂直行业模型)将带来海量碎片化推理需求,市场规模有可能超过训练。
激活“训推一体”,驱动协同增长
目前,DeepSeek凭借算法优化与混合精度训练技术,将大模型训练成本显著降低,一改往日大模型训练“大力出奇迹”的画风。DeepSeek推动AI普惠化的同时,国产厂商也有望借鉴DeepSeek的技术创新经验,在推理侧开拓新蓝海。
以摩尔线程为代表,作为一家专注于全功能GPU设计的企业,其正积极探索与DeepSeek相结合的AI应用与产品。
一方面,摩尔线程的全功能GPU已成功适配DeepSeek-V3和DeepSeek-R1原生671B模型,进一步验证了摩尔线程在软硬件协同优化方面的深厚技术积累;另一方面,基于全功能GPU,摩尔线程与合作伙伴联合打造的多款智算一体机已完成与DeepSeek等主流大模型的深度适配。
例如,摩尔线程与雪浪云联合打造的“软硬件紧耦合”大模型训推一体机——雪浪MindCenter X100,凭借其卓越的性能和灵活的架构,已成功部署DeepSeek-R1-Distill-Qwen推理服务,并在多种中文任务中展现了优异的性能。
“对于摩尔线程来说,DeepSeek的V3和R1进一步验证了我们GPU产品在功能上的前瞻性,特别是对FP8精度的支持和不牺牲算力的异步通信能力。”吕其恒讲道。
随着DeepSeek模型在多个智算中心快速部署,推理算力需求激增,面向推理侧和训练侧的部署调整,吕其恒认为,短期内,国产GPU厂商应保持训练芯片的持续迭代,比如最好支持FP8,确保技术不脱节),同时通过推理芯片快速切入商业化场景。从长期上,应瞄准“训推一体”架构(如摩尔线程MUSA),通过统一计算平台降低客户切换成本,最终在自主生态中实现训练与推理的协同增长。
技术门槛迁移,迎接“多元共存”
在AI芯片行业,“生态兼容性”始终是国产厂商难以跨越的隐形门槛。英伟达凭借CUDA生态构筑的技术护城河,曾让国产GPU在训练场景中举步维艰。然而,DeepSeek开源模型的推出,配合国产芯片厂商的战略协作,正在重塑这一游戏规则。
“长期来看,随着国产替代的推进、算法优化能力的提升,以及行业对供应链安全的重视,将逐步降低单一依赖风险。”吕其恒指出,这一过程需要时间和技术积累,但已是不可逆的趋势,未来的算力底座更可能呈现“多元共存”的形态。
尽管当前国产AI生态仍面临不同厂商技术框架兼容性不足、技术标准碎片化,垂直领域付费模式不甚清晰、商业闭环尚未成熟,行业巨头生态绑定式制约、全球化竞争压力等多重挑战。
在技术与产业的双重考量下,我们可以看到,摩尔线程携手行业伙伴探索构建全国产“算法-芯片-场景”的生态,验证了AI国产自主发展创新的道路是完全可行的。
在技术验证与突破上,摩尔线程接入DeepSeek,验证了其自研全功能GPU的通用性与CUDA兼容性,这表明国产GPU在复杂AI任务中具备强大的支持能力,为国产AI技术的自主可控发展奠定了坚实基础。
在生态协同上,DeepSeek的开源模型与摩尔线程的硬件实践形成国产闭环,将进一步推动国产AI硬件与软件的协同发展。这种协同不仅提升了整体性能,还为未来更多大规模模型的部署提供了技术保障,有助于构建更加完善的国产AI技术生态。
在产业协同与集群效应上,无论是摩尔线程的行业合作,还是其他国产芯片厂商的接入与适配实践,都将吸引更多上下游企业参与到国产AI生态建设中,形成产业集群效应,推动整个国产AI产业的发展。
在开源与普惠化上,DeepSeek的开源模式降低了AI技术的使用门槛,摩尔线程的高效部署使得更多开发者能够基于国产GPU进行AI应用创新。这种开源与普惠化的结合,也将推动AI技术的广泛传播和应用,促进国产AI生态的繁荣。
目前,摩尔线程已经在制造业、工程机械、新能源、教育、金融等多个行业中落地应用,展示了国产GPU在复杂AI任务中的强大支持能力。
吕其恒介绍,未来,摩尔线程将持续深化与开源社区合作,通过技术开放与生态共建,推动国产全功能GPU在AI计算领域的规模化应用,并协同多家生态伙伴形成的强大的生态网络。
结语
DeepSeek的横空出世绝非偶然,产业协同创新更是发展必然。从产业链上游的算力基础,到中游的模型研发和数据训练,再到下游的垂直应用与合作,折射出了中国AI产业从“追赶者”向“定义者”转型的集体野心。摩尔线程的实践证明,当算法创新、硬件突破与生态协作形成合力时,国产算力有能力在市场占据一席之地。深耕技术自主、生态开放以及场景纵深的破局之路,2025年,国产算力芯片大有可为。