刘聪(科大讯飞副总裁刘聪：认知智能大模型的技术阶跃及颠覆式影响

科大讯飞副总裁刘聪：认知智能大模子的武艺阶跃及推翻式影响｜WISE2023推翻AIGC产业提巅峰会

5月23日，36氪举行「推翻·AIGC」产业提巅峰会。本次峰会会聚产业力气，协同探究企业、行业在面临厘革时的应对战略，分享思索，探究和发觉产业中最具潜力的企业与最具代价的武艺，在荡漾的情况中探寻前行的朝向。

大会上，科大讯飞副总裁、研讨院院长刘聪公布了题为《认知智能大模子的武艺阶跃及推翻式影响》的主题演讲。刘聪以为，大模子“智能涌现”开启了机器天然言语交互式学习的“类人”新范式，将改动信息分发、获取、消费和交互办法，推翻传统编程形式，增速科研事情，提高消费力。

刘聪指出，只管现在通用大模子仍存在“张冠李戴”、没有人类“灵光乍现”才能等成绩，但基于科大讯飞此条件出的“荡漾效应”的看法，随着模子取得的数据和反应增长，以及知识茂密型数据标注工程的助力，体系偏差会渐渐低落。

具体到AI2.0与1.0年代的不同，刘聪引用科大讯飞团结创始人徐景明的看法表现，AI1.0年代是拿着武艺寻觅场景与成绩，由于通用性受限，必要对特定场景、行业定制，面临本钱热血、不成持续等成绩；而认知大模子的显现带来了三个破局点：面向不同场景团结不同东西更高效地主动捶打钉子、可以捶打种种千般的钉子、锤子也变得愈加便宜。

科大讯飞副总裁、研讨院院长刘聪

以下为刘聪演讲实录（经36氪整理编纂）：

各位好，今天十分兴奋能分开36氪推翻·AIGC产业论坛。

今天我的演讲主题是《认知智能大模子的武艺阶跃及推翻式影响》。从这个标题可以看出，一方面会有我们关于认知智能大模子武艺的了解，另一方面也会带来5月6日公布的讯飞星火认知大模子“1+N”体系的解读。

起首来看认知智能大模子的武艺阶跃。

各位这段时间以来都在议论的大模子武艺，由于快速的厘革，以及给产业、产物带来的迭代，多几多少给干系行业的从业者、包含像我们做武艺研发的人带来一些焦急。

ChatGPT在11月30日公布，上线两个月活泼用户破亿；比尔盖茨说大模子“汗青意义不亚于PC或互联网诞生”；GPT-4公布后各位十分眷注它的多模态才能，客观来讲其在很多言语才能上的提升愈加值得器重；谷歌大脑与DeepMind兼并，并且推出了PaLM2，后果也值得持续眷注。

认知大模子展现出的智能涌现推进了通用人工智能的武艺阶跃。微软研讨院曾公布过一篇名为《通用智能的星星之火》的论文，摆列分析了GPT-4的多种才能，可以看出模子和数据都是可行的；ChatGPT公布时就公布了在48项职责上的才能特点；再看国内，本年4月28日中共中央政治局聚会会议上也提出“要器重通用人工智能的提高”。

因此，团结ChatGPT给出的48个主要职责，以及科大讯飞人工智能开放创新平台上400多万开发者关于通用智能种种需求的分析，我们提炼出通用人工智能的七大维度：文本天生、言语了解、知识问答、逻辑推理、数学才能（文本模子想要处理数学成绩并不容易，和专多数学功效不一样）以及代码才能，再拓展到多模态才能。

我十分赞同刚刚微软韦青总提到的两个看法，第一是我们怎样评价一件事要和想做的目标亲密干系，我以为做大模子不克不及只聚焦一两个成绩朝向，正因云云我们重申提高和评价认知大模子才能，起首必需有封建体系的评测体系。

第二我十分赞同刚刚韦总提到的实践是查验真理的唯一标准。仅凭几个成绩测试就评价大模子的才能并不封建，怎样让各位全盘了解大模子的才能以及实践使用至关紧张。从武艺角度来看，我以为ChatGPT是一款十分精良、告捷的产物，由于有亿万用户在真实体验、公布以为和看法。

因此，我们以为认知大模子应当有更全盘的评测标准及体系，由中国封建武艺大学和科大讯飞承建的认知智能举国重点实行室团结中科院人工智能产学研创新同盟、长三角人工智能产业链同盟计划了通用认知大模子评测体系，协同探究后构成了掩盖7大类481个细分职责典范。

我们再往返忆一下认知大模子是怎样完成智能涌现的。

ChatGPT实质上仍旧是个深度神经网络大模子，也是一个对话式的AI体系——这里重申一下，不是对话体系。有人说ChatGPT是个谈天东西，但我们以为ChatGPT不仅加强了谈天机器人的功效，更紧张的是它能用各位熟知的prompt办法把种种职责一致输入大模子，一个通用大模子就能处理云云之多的职责和才能。

为什么智能涌现故意义？由于ChatGPT的智能涌现开启机器天然言语交互式学习的“类人”新范式。文本本身就是笼统出来、合适人类相反的历程，不管是学习哪个范畴里的知识，机器都可以像人类一样去学习，真正把握和运用中心言语与知识。

3月14日，GPT-4正式问世，我们看到了GPT-4的多模态才能，但更紧张的是它在很多职责上的专业才能持续提升，在成绩回复上更宁静可控，以及可以处理更长的上下文。我们以为GPT-4之以是可以告捷，最中心的仍旧是言语贯串的才能。GPT-4多模态眼前的武艺，是对图像、图像OCR笔墨、笔墨输入协同举行特性编码，并将图像特性以团结练习的办法对齐到一致语义空间。

我们也必要了解通用大模子的真正用处以及大模子还存在的实用性成绩。比如，“张冠李戴”就是大模子本身的一个缺陷，由于它是字符接字符天生的，而不是直接copy片断；另有新知识难以及时更新、“只读形式”大模子无法学习、没有人类“灵光乍现”才能等成绩。

大模子的显现也让数据迭代与以往不同了。ChatGPT作为先行者，全天下精良的科技后果、履历和专业人士都在给ChatGPT和GPT-4奉献伶俐。大模子的伶俐才能自提高必要全天下知识和用户反应的喂养，这关于大模子提高来说十分紧张。

在这里也和各位分享一下我们提出的“荡漾效应”这个看法，由于“荡漾效应”正在增速认知智能的“智能涌现”。

2010年时讯飞推出了讯飞云平台（后为讯飞开放平台）与讯飞输入法后，我们也提出了“荡漾效应”的看法：人工智无能系武艺被人们使用时是一点点分散的，越来越多的人使用，也会不休奉献数据和反应，体系偏差也会随之越来越小，就像水波纹的振浮一样。

以语音为代表的感知范畴的确获益于荡漾效应，比如我们的语音识别体系，聚集算法、数据等之后其错误率一连8-10年每年相对下降30%以上。

如今有一个新的内容叫认知智能数据标注工程，“荡漾效应”相反实用，但和我们刚刚说的语音、图像范畴又不一样。原本的数据标注属于劳作茂密型，平凡人经过简便培训之后就可以利用；但认知大模子触及到多样的范畴、专业，数据标注已转化成知识茂密型，源源不休的增量知识数据是大模子智能涌现的坚固基本。

做一个小结：

第一，从现在来看大模子极限十分高，将来涌现出和人类伶俐接近的机器智能有渴望。

第二，“纯笔墨天下”的对话式AI体系在很长一段时间内十分紧张，这种AI体系和人机协同是很好的计划，不仅能闭环自洽、并且文本资源十分多。

第三，一致的深度神经网络大模子具有很强通用性，是迈向通用智能的星星之火，将来必要进一步研讨。

第四，认知大模子将来可以在活动智能、多模态智能、具身智能等其他范畴完成推利用用，在武艺和产业上有宏大空间。

接下去，给各位先容一下5月6日公布的讯飞星火认知大模子的研讨历程和使用实践。

认知大模子的“智能涌现”带来了处理人类刚需的全新机会，我们在本年2月提炼出认知大模子带来的六个厘革：

第一，改动信息的分发和获取办法。不管传统搜刮照旧视频流，信息分发将来都市产生厘革；

第二，革重消费内容，写作变得会更容易；

第三，全新天然的交互，万物互联下种种交互都市产生厘革；

第四，完成专家级的假造助手，更多人能享用到教导、医疗等行业的资源普惠。

第五，推翻传统手工编程办法。

第六，成为科研事情的增速器，大大提升消费力。现在以前可以做到对文献内容做整合抽取和分析。

讯飞为什么能从客岁12月15日启动攻关以来，在半年内就做出讯飞星火认知大模子？

“很多你看到的如今，是看不见的已往”。实践上讯飞为大模子的智能涌现做了多年的源头中心武艺储存，2012年我们的语音评测初次经过人类专家水平，2014年我们提出“讯飞超脑”方案，就是要让机器完成能了解会思索，2017年，认知智能国度重点实行室获批，2022年进一步推出“讯飞超脑2030”方案，让机器懂知识、善学习、能提高，另有我们在种种国际威望武艺比赛中持续夺冠，都是已往十余年的武艺积累。

我们还拥有认知智能举国重点实行室、语音及言语信息处理国度工程研讨中央、国度新一代人工智能开放创新平台三大国度级平台。

基于以上，我们在客岁12月15日启动“1+N”大模子攻关方案，既要做“1”的底座模子，也要围绕教导、医疗、交互、办公、汽车等如此的场景同步推消费物。从启动攻关的第一天，我们的武艺路途就以前十分明了，全盘对标ChatGPT给出的48项职责才能，历程中依照方案一步步踏实行进。

5月6日，我们正式公布了讯飞星火认知大模子。给各位快速看一下讯飞星火七大中心才能的展现，此中有一些幽默的成绩都泉源于各位的发问；多模态才能的展现中，各位可以看到语义贯串、主动天生的假造人。

行家业使用中，可以看到在教导范畴，搭载了讯飞星火认知大模子的科大讯飞AI学习性可以层层修改点评中英文作文，基于上百名教员的作文评分修改纪录分析，星火认知大模子在中英作文修矫准确率、错误召回率、句子修订精巧率上以前凌驾寻常教师的水平；在言语学习上，基于讯飞星火可以完成自在开放式话题的白话练习情况，制止“哑巴英语”。

在办公范畴，基于讯飞星火完成了聚会会议纪要、语篇规整、一键成稿、阅读择要等才能的晋级，让办公愈加高效。今天各位听了报告，只需把灌音上传到讯飞闻声里，选择本人想要的稿件朝向就能一键天生相应的稿件。另有在汽车、数字员工等范畴带来的全新厘革。

这里我想说一个很故意思的话题，是科大讯飞团结创始人徐景明在本年年初提到的一个看法：之前，是拿着AI武艺寻觅场景与成绩，但其通用才能很难在不同的场景实用，就像拿着锤子找钉子却发觉每个钉子都不一样，衍生了行业定制繁复、本钱昂贵、不成持续等成绩，锤子的代价也在市场的剧烈竞争中散失。

但是认知大模子的显现像“雷神之锤”，从三个方面举行破局：面向不同场景团结不同东西更高效地主动捶打钉子、可以捶打种种千般的钉子、锤子也变得愈加便宜。在降本增效的基本之上，认知大模子与行业场景的严密团结也能不休反哺大模子本身才能持续提高。

5月6日公布之后，讯飞星火在年内另有三个持续晋级的紧张里程碑。6月9日要打破开放式问答，多轮对话才能和数学才能再晋级；8月15日，打破代码才能并完成多模态交互晋级；到10月24日时，我们要完成通用模子对标ChatGPT，中文跨越、英文相当。

以是我以为，中国认知大模子提高不仅要有“弯道超车”，更必要在向目标致敬的同时具有直接对标、追逐和跨越的勇气，以是还必要“直道冲锋”。产业界和学术界也必要深度团结、协同并进，在大模子长奔之中持续注入不竭动力。

从PC年代的win-tel，到挪动互联网年代iOS和安卓两个生态体系，再到搜刮生态体系，我们信赖将来大模子本身就能动员一系列的上卑劣产业链、武艺链，构成新的生态。

现在，讯飞开放平台也在团结讯飞星火赋能更多开发者打造更具代价的AI使用，共建“星火”生态。

信赖通用人工智能的星星之火，必将在中国大地构成燎原之势。我们渴望以讯飞星火认知大模子为新的出发点和燃点，和各界一同用人工智能建立优美天下。

整理｜沈筱

刘聪(科大讯飞副总裁刘聪：认知智能大模型的技术阶跃及颠覆式影响｜WISE2023颠覆AIGC产业发展峰会)

科大讯飞副总裁刘聪：认知智能大模子的武艺阶跃及推翻式影响｜WISE2023推翻AIGC产业提巅峰会

相关推荐