OpenAl采用智谱标准评测GPT-4.1系列大模型

作者:王鹤迦 责任编辑:王鹤迦 2025.04.17 08:01 来源:通信世界网

通信世界网消息(CWW)OpenAI发布的最新GPT-4.1系列大模型,其中在评测函数调用能力时采用了ComplexFuncBench。

ComplexFuncBench是由智谱团队提出的专用于评估大模型复杂函数调用能力的测试基准。

据悉,ComplexFuncBench主要评测大模型在128K的长上下文下进行多步带约束的函数调用的能力。相比于现有函数调用测试基准,ComplexFuncBench要求大模型对真实场景下的用户需求进行细粒度理解,并在此基础上进行多步带推理的函数调用,这对模型的函数调用能力提出了更高的挑战。


通信世界网版权及免责声明:
1、凡本网注明“来源:通信世界全媒体”及标有原创的所有作品,版权均属于通信世界网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、凡本网注明“来源:XXX(非通信世界网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。
发表评论请先登录
...
热点文章
    暂无内容