首个基于知识的视图万物布控大模型发布

责任编辑:王鹤迦 2025.01.03 08:31 来源:电信

通信世界网消息(CWW)近日,TeleAI发布业内首个基于知识的视图万物布控大模型—Telesearch 2.0,打破模态间信息孤岛,可根据自然语言精准检索图片/视频,实现跨模态复杂语义精准理解、超万种目标精准检索。在自然语言的基础上,Telesearch 2.0支持上百个专业知识文档挂载,在理解复杂文档内容基础上,实现根据自然语言精准检索视觉,如根据全国几百部交通法规,搜索“机动车压线”,Telesearch 2.0能在理解复杂法规基础上进行逻辑推理,准确检索出存在“机动车压线”行为的视频。TeleAI用最前沿跨模态大模型检索技术,打破传统标签化检索壁垒,变革人们日常生活;勇担央企责任和使命,用AI技术,维护公共秩序,守护社会安全,赋能城市治理智能化升级,用科技驱动社会进步。

从标签、自然语言驱动视觉检索到基于复杂知识的视觉检索

开创视觉检索新格局

在信息爆炸的时代,如何高效、精确地从海量数据中检索出所需信息已成为亟待解决的难题。传统标签式检索已难以满足实际生活、工作中精准检索的需求,特别是在专业场景下许多任务往往更加复杂,已经远远超出了通常视觉任务的范畴,目标或事件都由专业术语、规则来定义,需要深厚的行业知识和逻辑推理能力。

为了提升视觉大模型结合行业知识对复杂事件的理解和推理能力,TeleAI围绕知识可用和回答可信两个目标展开攻关,在细粒度多模态文档理解、视觉语言高效对齐、基于知识增强的长上下文感知理解技术上取得了突破,实现从根据标签检索、自然语言驱动的检索,到基于专业行业知识的检索的跨越,实现一键构建“行业专家”。

中国电信凭借在各行业深耕多年的优势和经验,积累了超亿级大规模训练数据及多模态标注数据,在中国电信集团 CTO、首席科学家、TeleAI院长李学龙教授带领下,坚持自主研发创新,结合视觉-语义模态各自特点与相互关系,创新性提出了基于多模态表征融合的检索架构,建立了大规模的多模态检索体系,统一表示视频、文本和图像等多种模态数据,检索精度达到业内领先,有效检索挖掘形成超亿级大规模训练数据。

image.png


通信世界网版权及免责声明:
1、凡本网注明“来源:通信世界全媒体”及标有原创的所有作品,版权均属于通信世界网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、凡本网注明“来源:XXX(非通信世界网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。
发表评论请先登录
...
热点文章
    暂无内容