通信世界网消息(CWW)2025年DeepSeek横空出世,喧嚣3年多的大模型终于落地生根,进入大众视野,当业界还在为AI上云争论不休,一场关于终端设备的AI革命正在悄然开启,DeepSeek的应用战场也从云端顶部,向拥有万亿级规模的终端“毛细血管”开始迁移。
从智能手机拥有实时翻译,到自动驾驶的毫秒级决策;从工厂机械臂的精准控制,到家庭音响的语音交互,人工智能不仅是智算中心万亿级参数的集中运算,更应该是万物智联 版图下的产业新生。
事实上,AI从云端下沉终端的迁移早在几年前就展露端倪,但DeepSeek的出现却为过程按下了“加速键”。无法忽视的客户刚需和算法创新带来的技术突破,也成为端侧AI撬动万亿物联终端市场的核心关键。联通数字科技有限公司(以下简称联通数科)作为AI领域的产业先行者,看准这一发展趋势并率先行动,其打造的新型物联网操作系统——格物OS通过与DeepSeek进行端侧适配,构建了完整的端侧AI技术栈,这一创新成果已通过电梯预测性维护场景验证,成为国内首个此融合技术落地该场景的实践案例。
终端革命:从云到端,AI为何要“下沉”?
虽然当下云端AI还是很多ToC用户接触DeepSeek的主要方式,但在更为广阔的企业级市场,AI下沉至端侧却成为用户“刚需”:从安全层面,自动驾驶对于紧急制动响应速度的严苛;从数据保护层面,医疗行业对于诊断数据的隐私保护;从投资成本角度,很多中小企业根本无法承受AI带来的算力成本。总而言之,响应速度、隐私保护、成本负担正在成为企业级市场呼唤AI“去中心化”的核心诉求。
然而,AI下沉并非易事。一方面早期的终端芯片难以承受大模型,导致性能缩水功能失真;另一方面,算法适配的复杂性也让模型部署呈现碎片化。DeepSeek的出现成功打破了云端AI的技术僵局,至此大模型不再只是少数科技巨头的专属领地,科技企业也可暂缓AI军备竞赛的进程——通过模型压缩技术,DeepSeek将千亿参数模型缩减至终端侧可运营的十亿级规模,用最小的性能损失换来算力需求的陡级降落,以DeepSeek-R1为例,通过“模型蒸馏与量化”技术,手机端生成高清图片速度不到1秒,而云端方案因网络传输限制难以突破2秒门槛,这种“零等待”体验,正是智能汽车规避碰撞、AR眼镜实时交互等场景的刚需。
凭借优秀的本地化AI处理能力,DeepSeek成功为万千终端设备装上“智慧大脑”,也就是说,在不远的将来,无论是工厂里的一颗螺丝,还是农田中的一架无人机,都将成为AI网络的神经元。比如智慧工厂中,作为枢纽的边缘网关可以协调数百个传感器,正是端侧AI的最佳场景,通过本地AI模型实时分析设备振动数据,预测故障并自动调度维修,帮助工厂的故障停机率大幅下降。
这种“终端感知-边缘决策-云端协同”的混合架构,正在重新定义智能的边界。不过需要注意的是,终端设备的AI化绝非是简单的算力堆砌,而是硬件、算法与场景的深度融合——在这方面,联通数科自主打造的格物OS与DeepSeek的深度适配,就为业界提供了一个不错的行业范本。
融合创新:格物OS与DeepSeek大模型 深度融合构建端侧AI新范式
联通数科以自主研发的新型物联网操作系统格物OS为抓手,推进在端侧智能领域的关键核心技术攻关。格物OS是智能硬件的“数字管家”与资源调度中枢,为开发者提供标准API接口 与全链路管理能力,支撑多场景应用高效运行,帮助开发者快速开发和部署物联网应用。
目前,联通数科选取自主研发的泛在物联网网关,率先完成了格物OS与DeepSeek大模型的适配部署。泛在物联网网关作为一款高度集成化的物联网核心设备,内置6TOPS NPU 算力资源,通过集成格物OS,可支持边缘计算框架和AI推理引擎,支持Wi-Fi、BLE、Zigbee等7种网络协议泛在接入,配合联通数科自主打造的格物平台可实现亿级消息转发和毫秒级实时数据存储。当下,通过对DeepSeek-R1模型的量化与转换,已实现DeepSeek-R1-Distill-Qwen-7B模型在泛在物联网网关的本地化部署。本地化部署的DeepSeek模型打破网络传输存在的诸多限制,规避了时延响应、用户敏感数据泄露等问题,对于满足隐私保护、提高可靠性、降低延迟、降低云端计算负载等方面都具备独特优势。经过实测,本地化部署方案内存占用小于8GB,CPU/NPU占用率约40%/90%,推理响应时间在100ms内。基于格物OS与DeepSeek的融合,网关可与格物平台形成云边端协同体系,实现算法模型下发、算力动态调度与边缘自主运算,构建出具备实时响应与弹性扩展能力的端侧AI框架,推动轻量化AI技术在物联网终端的商业化落地。
行业首个:率先实践电梯预测性维护项目 开启多领域应用新篇章
在天津某大厦电梯预测性维护推广项目中,泛在物联网网关依托DeepSeek模型定向调优与实时数据采集技术,通过动态分析电梯运行参数,实现故障精准预判及维保需求识别。基于格物OS的容器化部署技术,网关还可以灵活集成其他智能模型,如集成电动车识别模型联动摄像头实现违规入梯监测,支持毫秒级报警触发与异常解除后业务自恢复。这种“AI预判+实时阻断”的智能运维体系,既强化了设备安全性与运行稳定性,又通过边缘计算将核心业务逻辑闭环于端侧,进一步验证了本地化AI在实际场景中“低时延响应-高可靠决策-轻量化部署”的技术优势。凭借泛在网关的AI能力,可以在工业设备健康管理、智慧园区安防升级、智慧农业精准调控等场景中进行复用,实现“一终端多场景”的通用性。
格物OS与DeepSeek大模型协同构建了“边缘智能感知-云端全局优化”的双向闭环,推动云边协同从基础资源联动向智能决策协同演进。未来,随着技术的不断成熟与应用的持续深化,联通数科将加速推动物联网终端智能化发展,助推更多行业向更加智能、高效、安全的数智化未来迈进。