这家大模型豪言半年内超越ChatGPT 全球通讯

作者/于惠如

图/全天候科技

“认知大模型成为通用人工智能的曙光，科大讯飞有信心实现‘智能涌现’。”

(资料图片仅供参考)

5月6日，科大讯飞星火认知大模型揭开神秘面纱。发布会上，科大讯飞董事长刘庆峰、科大讯飞研究院院长刘聪在现场实测了讯飞星火在七大维度上的核心能力，包括多风格多任务长文本生成、语言理解、泛领域开放式知识问答、情境式思维链逻辑推理、多题型可解析数学、多功能多语言代码，以及多模态输入和表达等。

讯飞星火认知大模型发布的同时，科大讯飞也发布了基于该大模型的教育、办公、汽车和数字员工等多个领域相关产品。

星火认知大模型始于2022年12月。彼时，科大讯飞启动“1+N”大模型技术攻关，其中，“1”代表通用认知智能大模型算法研发及高效训练方案底座平台，“N”代表大模型在教育、办公、汽车、人机交互等各个领域的落地。

“当前，在文本生成、知识问答、数学能力三大能力上，讯飞星火认知大模型已超ChatGPT。”刘庆峰在发布会上表示。

与此同时，刘庆峰还给出了讯飞星火的迭代时间表及每阶段目标：第一阶段，在6月9日，突破开放性问答，如实时问答；多轮对话能力再次升级；数学能力再上台阶。第二阶段，在8月15日，突破代码能力；多模态交互能力正式开放给客户。第三阶段：10月24日，在通用大模型领域对标ChatGPT，其中中文能力超越后者，英文能力与后者相当。

此外，据刘庆峰透露，科大讯飞还将在今年推出医疗行业大模型。

发布会现场，刘庆峰用“最强”、“已超ChatGPT”、“遥遥领先”等词形容讯飞星火认知大模型的部分能力，但他同时也承认讯飞星火仍然存在一些问题。比如：对新知识难以及时更新；事实类问答容易出现“张冠李戴”；史实、传统典籍等容易“编造情节”等。

目前，星火认知大模型已对外开放测试。

现场实测七大核心能力

与百度文心一言、阿里通议千问不同，讯飞星火没有在发布会上使用提前录好的demo版本，而是在现场实测了其七大核心能力。

从现场演示效果来看，星火认知大模型基本能够流畅完成交付的各项任务。另外，讯飞星火体现了科大讯飞的一贯强项——语音能力，它可以通过语音转文字进行问答，这也是其优势所在。

演示中，刘聪让星火认知大模型写邮件、做方案、写新闻通稿、生成英文宣传文案等文本生成功能，讯飞星火均流畅地完成了任务。

现场演示的讯飞星火的语言理解能力也在线，它理解了特定的句子和场景含义，随着问题的变化，也调整了自己的答案

在数学能力中，除了常规计算、几何、情景应用等，讯飞星火解答了复杂的计算题答案。在刘庆峰看来，数理能力一定程度代表了一个大模型的聪明程度。“讯飞星火大模型不仅在国内系统中遥遥领先，也超过了ChatGPT。”

此外，刘聪还展示了大模型面向泛领域开放式知识问答能力、逻辑推理能力与代码能力。在多模态能力方面，星火大模型能够根据关键词句生成语音、图片、视频等素材，并可生成虚拟人进行视频展示。

不过，据官方介绍，讯飞星火的多模态能力目前还在测试中，最迟8月会提供给VIP客户使用。

打通“大模型+产品”闭环生态