21世纪经济报道记者杨清清 合肥、北京报道

刘庆峰看起来心情不错。


(相关资料图)

5月6日,科大讯飞正式对外发布星火认知大模型。在长达两个小时的现场实时演示中,这位科大讯飞董事长,与科大讯飞研究院院长联手对外展示了星火大模型的诸多能力。其中既包括文本生成、语言理解、知识问答、逻辑推理、数学、编程、多模态等基础能力,也涵盖教育、办公、汽车和数字员工四个行业应用成果。

用内容量爆炸来形容这场发布会,绝不为过。本次发布会原定时长为1小时,然而由于现场实时演示内容太多,发布会严重超时至近两小时才结束。不过,尽管节奏拉长,但发布会现场人头攒动,直至快结束时观众席侧面的演示大屏前,还挤了不少无座站立、聚精会神观看演示的观众。

“我们本来想控制在一个半小时,觉得做一次发布会时间不要太长,还砍掉了不少演示内容,生怕大家太辛苦。”在媒体采访间,刘庆峰主动与记者们互动道,言语中颇有些兴奋。这也是他近年来罕见接受媒体采访。

这一切,都指向了刘庆峰及科大讯飞对星火认知大模型的期待。在发布会的开场演讲中,刘庆峰底气十足地放出豪言:星火认知大模型将对标ChatGPT,并于今年10月在中文能力上超越后者、英文水平与后者相当。

尽管此言虚实还有待时间印证,不过资本已经在用脚投票。5月8日,作为星火认知大模型发布后的首个交易日,科大讯飞开盘涨超4%,此后股价迅速走高,早盘强势封停涨板至全天收盘。截至收盘,科大讯飞报收63.86元,总市值为1483.52亿元。

而面对国内AI大模型热潮、AI大模型商业模式等话题,刘庆峰也有自己的“冷思考”。

用技术抹平时间差

作为AI国家队,科大讯飞此次发布的星火认知大模型,颇受外界关注。

星火认知大模型也通过现场表现,回应了外界的期待。在发布会现场,通过语音输入与实时互动,无论是文本生成、语言理解,还是知识问答、逻辑推理,亦或是数学能力等,星火大模型都表现出色。

需要注意的是,自今年3月16日,百度在国内首次推出类ChatGPT产品“文心一言”后,近两个月来,国内众多科技公司都在紧锣密鼓地跟进。而早在2月,科大讯飞便透露了AI大模型的动作,却直到5月6日,才正式揭开星火认知大模型的“面纱”。

不过,面对与其他科技公司近两个月的时间差,刘庆峰却不以为意。

“我觉得外界可以重新评估一下,(AI大模型)不是谁更早或晚一个月发布的问题,而是要关注在今天这个时点上谁的水平最高。”刘庆峰向包括21世纪经济报道在内的媒体直言道,“我自己可以非常自豪地告诉大家,在我们能测到的国内各种平台中,讯飞的水平是最好的。”

刘庆峰的判断并非没有依据。在星火大模型发布现场,科大讯飞一口气公布了覆盖7大维度能力、共计481个细分任务类型的通用认知大模型评测体系。据介绍,该评测体系由科大讯飞认知智能全国重点实验室牵头设计,并与中科院人工智能产学研创新联盟和长三角人工智能产业链联盟共同探讨形成。

其中的7大类能力,来自于ChatGPT关注的48个主要任务方向和讯飞开放平台上400多万开发者团队的需求分析。而具体到481项细分任务,则来自于单项10个左右、共计超过4800个案例的背靠背测试结果。

刘庆峰透露,在这个评测体系下,星火认知大模型在多任务、多风格的长文本生成方面,明显领先国内其它玩家。在发挥“工具”能力的前提——自然语言理解方面,星火认知大模型的领先优势更甚。

值得注意的是,刘庆峰坦承,国内部分科技企业在数据层面颇有优势,但“搜索完要理解,才能用更好的方式呈现”,而对自然语言的理解,正是星火认知大模型的一大优势所在,“所以我认为(发布)时间根本不晚。”

对标GPT 3.5

与此前种种发布时使用的“类ChatGPT”标签有所不同,此次科大讯飞入局,则旗帜鲜明地喊出“对标ChatGPT”、甚至部分能力“赶超ChatGPT”的口号。在发布会现场,刘庆峰指出,当前讯飞星火认知大模型已在文本生成、知识问答、数学能力三大能力上超过ChatGPT。

同时,星火认知大模型还在快速迭代的过程中。刘庆峰透露,今年6月9日,星火大模型将突破开放式问答,多轮对话能力和数学能力再升级;8月15日,星火认知大模型将突破代码能力,多模态交互再升级;10月24日,星火认知大模型通用模型将直接对标ChatGPT,其中中文能力超越后者,英文能力与后者相当。

“我们有信心在6月、8月和10月的三个版本中,让大家看到我们在通用AI大模型上所带来的惊喜。”刘庆峰表示。

在接受采访时,刘庆峰再度主动提及此事,并进一步解释称,目前星火认知大模型主要对标搭载GPT 3.5的ChatGPT。刘庆峰介绍,根据通用认知大模型评测体系的结果,星火认知大模型在自然语言理解上与ChatGPT还略有差距,但“有信心很快赶上”。在中文领域,以5分制来计算,目前科大讯飞与ChatGPT的得分差距仅为0.19分。

不过,刘庆峰也多次向OpenAI及ChatGPT表达了敬意。他指出,早在OpenAI推出GPT-3时,科大讯飞便有所关注,但当时看到的效果是,在部分如医疗、教育在内的垂直领域,大模型的能力反倒不如几十亿参数规模的小模型。然而ChatGPT推出后,却带来了效果层面的惊喜,随即科大讯飞迅速启动“1+N”大模型即星火认知大模型项目。

与此同时,刘庆峰也直言称,当前中国在发展通用型人工智能时仍存在短板。一方面是算力,另一方面则在于高质量的数据。此外,要想实现通用人工智能的“智能涌现”,就需要在全球范围汲取知识,然而中国企业在面对全球多语种学习方面仍有差距。此外,中国企业在源头创新上的投入也有所不足。

不过,刘庆峰指出,当前我国愈发重视基础研究,国内算力企业、算法适配能力也在努力迎头赶上,且应用落地及快速迭代能力也是优势所在。“在这个基础上,中国企业未来在产学研合作方上下游抱团及生态发展,我对未来还是很有信心的。”

加速商业落地

对于AI大模型企业而言,技术如何进行商业落地始终是一个绕不开的命题,而科大讯飞亦有自己的思路。

在本次发布会上,除了星火认知大模型,科大讯飞同步发布了星火大模型在公司现有产品上的应用成果,包括AI学习机、讯飞听见、讯飞智能办公本、讯飞智慧驾舱等四项成果。这也使得讯飞通过AI大模型赋能现有产业模式可以直接实现商业落地,获得变现。

除了赋能自身产品外,科大讯飞还将继续开放AI能力。刘庆峰宣布,首批来自36个行业的3000余家企业开发者将接入星火大模型,联合各行业合作伙伴面向多个行业共建大模型“星火”生态。目前,讯飞开放平台已经开放了560项AI能力,并聚集了超过500万生态合作伙伴。

“科大讯飞一直认为,人工智能的发展绝不是单个企业和单个科研机构的事情,而是需要大家合作共赢的。讯飞将联合各行业合作伙伴共建大模型‘星火’生态,并与生态伙伴一起,燎原新一轮产业变革。”刘庆峰表示。

而在星火认知大模型的商业模式方面,刘庆峰向21世纪经济报道记者坦言,目前公司仍在持续设想中。“今天我们发布了1+N,那个‘N’的每个产品都是可以变现。”刘庆峰表示,无论是现场展示的教育、办公,还是一键成稿等,商业模式是现成可见的。而科大讯飞对外开放能力,也会形成一系列的行业解决方案,帮助合作伙伴看到更多的机会。

与此同时,科大讯飞也在思考更多的商业模式。“ChatGPT本身也给大家提供了一些模式,比如包月制、按服务量收费,甚至VIP用户等等,”刘庆峰表示,“这些逻辑是可以看得到的,是可以一步步往前走的。”

不过,刘庆峰也指出,讨论星火大模型对科大讯飞收入及利润的贡献度问题,还为时过早。“如果科大讯飞总是盯着这件事,我们也成不了伟大的公司。作为AI国家队,我们还是要先争取把AI大模型做到业界最好,并持续积极探索各个领域的应用落地,两头并进。”刘庆峰认为,“但至少它已经可以带来营收规模的正面影响。”(实习生师洁对本文亦有贡献)

推荐内容