刘庆峰:讯飞不是蹭华为流量 有人害怕我们大模型做得太好

更新时间:2023-10-25 08:09:07作者:无忧百科

刘庆峰:讯飞不是蹭华为流量 有人害怕我们大模型做得太好



雷递网 雷建平 10月25日

讯飞昨日举办第六届世界声博会暨2023全球1024开发者节活动。科大讯飞董事长刘庆峰、研究院院长刘聪发布讯飞星火认知大模型V3.0,称讯飞星火认知大模型V3.0七大能力持续提升,整体超越ChatGPT,医疗领域超越GPT-4。

讯飞还联合华为昇腾生态共同发布“飞星一号”大模型算力平台,并启动对标GPT4的更大参数规模的星火大模型训练。刘庆峰说,“大模型时代的大幕才刚刚揭开,对标GPT-4的更大参数规模的星火大模型正式启动训练,2024年上半年将实现对标GPT-4。”

刘庆峰随后在接受媒体采访时表示,飞星一号是讯飞跟华为共同搭建的完全国产算力,可以训练GP4的能力底座。

“我也不希望大家觉得我们老在蹭华为的流量和热点,讯飞是典型的高校的科技成果,是学生创业。我们在核心技术上梦想很多,商业化能力还是很弱,所以要向华为学习。但不是微缩版华为,其实我觉得我们跟华为的盈利能力和管理能力差距还挺大的。但讯飞一样有梦想。”

在讯飞发布星火V3.0之际,讯飞学习机却惹祸。有家长宣称在自家孩子的科大讯飞学习机中发现了一些扭曲历史等违背主流价值观的内容。

消息传出后,讯飞今日跌停,截至收盘,公司股价为46.7元,市值为1081.42亿元。

对此,刘庆峰表示,已在发现后第一时间下架内容,并对负责保障内容安全的合作伙伴作出处罚处理,同时内部已经将用于大模型上的内容审核机制放在了学习机上,力求使学习机的内容审核更加严格。

刘庆峰认为,这件事情的背后,有幕后黑手,有人在推,甚至恨不得把他推到热搜上,对讯飞的品牌美誉度有影响。这样做的目的是害怕讯飞大模型做得太好,害怕科大讯飞真的成为中国Number one,而且遥遥领先。“从一定角度上来说,这样的打压会让我们变得更成熟,也让我们变得会更健康。”

以下是对话刘庆峰部分内容:

提问:能否请您介绍“飞星一号”平台的发布对于国产人工智能产业发展的意义?

刘庆峰:飞星一号是我们跟华为共同搭建的完全国产算力,可以训练GP4的能力底座,这个平台中既有像华为这样的具备国产算力存储网络优势的企业,也有科大讯飞跟它联合研发的各种优质的算子库。

正是因为这些算子库的粘度才使得我们在训练大模型上的效率比原来的纯硬件,同样的硬件、GPU、网络和带宽效率可以提升一倍甚至更多,才使得我们有条件和基础明年来对标 GPT-4,而且今天我们发布的星火3.0可以说是国内第一个让华为除了他们自己内部应用之外,第一个真正的在国产算力平台上训练出来的大模型,能够对标 GPT3.5。

我们在这块做了很多的探索性的工作,很多的算子库已有的成果,将来都是给我们的国产的其他的科研单位和企业有非常好的借鉴和参考作用。

我们跟华为一起做的工作中有一部分是华为可以公开通用的给第三方客户的,有一部分是我们双方共有的知识产权,还有一部分是讯飞独有的,所以我们会形成对整个产业生态整个算力支撑,非常重要的解决卡脖子问题,也是世界第二种选择,我觉得是非常重要的事。

当然中美的科技背景下,我们并没想把很多的详细参数对外去宣布,但大家可能有很多人期待这个数据,但我想大家要看就等到明年上半年看,我们什么时候4.0出来,它的性能怎么样,我觉得这是第一件事。

第二件像中国声谷以及我们的国产的大模型,人工智能如何应对现在科技的竞争,我觉得第一个确实有利于形成产业的生态,有利于提供人工智能应用的场景,从而形成示范以后全面推广,可以形成政产研以及资本的整个联动,我觉得这都是非常有意义的事情。

另一个是应对国际化竞争,在布达佩斯世界田径运动会上讯飞中标了,我们跟全球PK,其实我们有多语种的全世界的各种技术很多也是在当地最好的。

但我们还是把当地最优秀的公司拉出来,即便跟我们差不多,甚至比我们还略差,但他有本地服务能力,有本地认证能力,把它集成在我们平台上,我们跟十几个来自欧洲各个国家以及我们亚洲国家的这些厂商联合推出来相关平台,不是要把大家都消灭,是要跟大家都合作,给大家更大的空间,就形成了我们以我为主的产业链和生态。

对我们的整个研究背景,应用背景和整个国际舆论氛围都非常好,所以这些企业愿意飞到合肥来,我觉得我们应该主动走出去,要用更开放的心胸,但其中一个前提是你必须有实实在在的硬科技,你能够让他觉得你确实强,他才愿意以你为主来合作。

提问:之前讯飞披露和华为合作生成的9100b可以对标英伟达A100。请问一下公司在芯片合作上,推理芯片和训练芯片哪一部分的合作相对多?

刘庆峰:推理芯片相对简单,国内也有些号称自己的芯片能够做大模型,主要是推理芯片方面。最难的是训练,我刚才说的1000张卡、三个月, A100训练一个1000多亿的模型,能做训练才是真正的国产范例。

在华为自己的一部分应用之外,我们是唯一一家,华为最新的芯片做出来的东西都是率先给讯飞搭建的完全自主可控平台上,也就是对标的是ChatGpt的星火3.0,下一步要做对标Gpt4的是训练,训练能做,推理就是非常简单的事情,推理当然我们同样也可以做。

提问:讯飞大模型面向公众开放已经有一段时间了,是否可以透露一下用户的数量大概有多少?商业化层面会有什么样的考虑?

刘庆峰:讯飞星火的各类用户已经是1,200万,增长不错。而且最高兴的是,有很多深度用户,在两三个月之内用了一两千次,做了很多事情,它确实解决了用户的问题。

第二,这个数据因为国内各家都在说到底谁多谁少,他用什么数据,我们是相对比较,比如说输入法,我就没算入其中,对吧?你不能把这一个多亿用户都算在这里面,我们说的是大模型直接相关的应用,开发者团队数量大概17万多,从我们看到的各家的数据,我们开发团队是最多的,而且是明显的比第二名要多。

那么这17万多中我上来说的有超过10万是企业级的开发者团队,有7万多是个人开发团队,其中有1.8万左右,将近2万是做小助手的团队,剩下的都是用API的。你可以做各种应用,所以我们从个人用户数上1,200万,开发者团队数是17万多,这个是业界开发者团队中最好的,至少从公开的时候数据上是这样的。

另外一个它还有很大的帮助,5月6号讯飞星火之后,我们的600多项的AI能力也更快地被消费者用起来,所以我们整个5月份之后到现在为止,新增的实名认证的开发者团队总量是130多万,只是跟大模型直接相关的是十七点几万,大概是这样一个数据。那么具体的商业模式,星火现在肯定还是暂时先免费,我们其实看到的现在一定现在就可以很多商业模式,但我觉得还是要先把这些场景做深再说。

另外对企业,它还是各种训练,根据星火需要的不同,它其实价值也不同,包括我们代码,我其实更希望推动一种模式,就像合同能源管理一样,你用了之后,我们共同搭建一个绩效管理的平台,共同形成对代码量、代码质量的认知,然后产生的新增效益分成,一定是给行业产生的增量价值,大家在中间再合作来分类,我觉得这事才能做得远。

提问:期美国又加强高端芯片出口管制,讯飞和华为的合作目前是以自由的训练为主,后期会不会还展开一些算力租赁之类的服务?

刘庆峰:我们不是因为今天美国出了新政策,才这么干的,我们早就这么干,讯飞的国产化替代从三年前就开始干了。去年10月份,我们又跟华为进一步深度合作,在星火正式研发之前华为特战队就已经在场了。而且在讯飞,我们去打磨华为的昇腾9100b这些系列平台,既有讯飞的需求,也有华为的需求,所以双方有战略联合,任正非都高度重视。

今天美国出现这个政策早就在我们的预期之中,所以没有什么新奇的,我只是觉得这件事情更加凸显了我们早做准备的必要性。

对讯飞来说,我觉得我们按照正常节奏去发展就可以了,但对于原来有很多抱有侥幸心理的厂商,他可能不得不赶快做调整。另外,在网上提供算力这件事情不是科大讯飞的生意,我们至少暂时不会做的,我们主要还是训练之后,我们自己的应用或者我们的开发者团队在我的云平台上对外提供服务,这个是有可能做的,我们不会单独做算力租赁系统。

提问:科大讯飞与华为的合作基于晟腾生态的飞信一号平台正式发布,背后最难的一关是什么?

刘庆峰:我也不希望大家觉得我们老在蹭华为的流量和热点,我觉得我们得向他学习,当然华为找到一个特别刚需的场景,强压式的在一个交换机,然后在通讯领域成功了,做手机,我们很羡慕,也有很多值得我们学习的。

讯飞是典型的高校的科技成果,是学生创业。我们在核心技术上梦想很多,商业化能力还是很弱的,所以要向他们学习。但不是微缩版华为,其实我们跟它的盈利能力和管理能力我觉得差距还挺大的。

但我们可能一样都有梦想,也许我们的梦想、我们的想法还更多一点,我觉得不用去比。刚才讲的飞行平台,最大的压力当然就是我们在做这件事情是我们自己的心态,你本来用英伟达可能一个月就能干成的事情,你要用华为,你的算的或者移植有各种不确定性,可能你三个月才能干完,那边市场上又在打仗。

所以假如我们现在不是用国产平台,我用已经成型的英伟达的平台,我今天星火的效果可能还会更好,但这一步你非走不可,而且能走到这步,我也认为华为非常令我们骄傲。我也为我自己的团队骄傲,所以他当时最大的困难是,你是在快速奔跑的过程中,别人用的最豪华的武器,而你一边在打仗,一边在磨练武器,一边在往前进步。

所以其实对心态的考验,对自己对未来长期战略的影响,我觉得都是非常重要的,而且在这个过程中你要投入就更多,你既要挣钱还要大规模投入,既有软件还有硬件,所以我想这个中间,说到底你是不是真的发自内心的坚信人工智能未来,坚信自己能够走出来,能够走到业界领先,否则谁都不会在这个过程中做这么多的比别人额外付出的投入。

提问:讯飞AI的学习机在内容审核上出现了一些不当的内容,公司也非常快速的反应了,进行了下架的处理,讯飞是否有更好的防范机制?

刘庆峰:我们在教育中一直高度关注信息安全,这次确实是一个意外,但我们内部已经做了处理了,是16号出现的事,也仅仅是一个家长发现的问题,他们是一个合作伙伴,跟我们有明确的协议说他要保障内容安全,刚刚放进来在试用,我们也在各个方面在审核。

所谓大家可以调的范围是大量的范围中的一篇,出现了这个问题,我们发现以后第一时间赶快下架,而且对合作伙伴做了处罚,我们内部也做了相应的处分,同时把我们用在大模型上的内容审核的机制,迅速放到学习机上做更严的审核。

在过去这么多年中,我们学习机已经成为业界知名度最高的学习机,我们被美国几次极限施压,是根正苗红的,中国自己的硬科技做的学习机,我们希望帮助每个孩子更好的因材施教,更好的心智发展,更好的身心健康,五育并举。

所以这就是主线条,中间出现意外,确实是合作伙伴说的内容太多,我们审核过程还没结束,相关人员就匆匆忙忙让大家在试用,导致的问题现在已经彻底杜绝了。

但从另外一个角度,我也觉得在中国做创新很不容易,今天星火3.0发布,如果大家在现场看到我们还有很多干货,做的还是相当不错的,但是在我们刚刚发布完,突然就发现铺天盖地舆情是有幕后推手的。

有很多的媒体朋友告诉我们,有人专门给他们喂料,要希望他们发,然后投资机构收到了,希望影响我们的股价,希望影响我们的社会形象。

说到底是什么?是因为害怕我们大模型做得太好,害怕科大讯飞真的成为中国Number one,而且遥遥领先。所以我觉得越是这种打压越激发我们的斗志,但同时越让我们看到教育,确实我们还要更加严格的把内容保障好,把我们的阳光健康的教育也落得更实。

从一定角度上来说,这样的打压会让我们变得更成熟,也让我们变得会更健康。

其实我们早就都下架了,还在传播,我们也给有关部门报告了,给我们的公安部门和网信部门报告了,我们也在取证,只不过在取证过程它有个周期。

有人在推,甚至恨不得把他推到热搜上,当然对我们的品牌美誉度有影响,但我想这些都是过程中的浪花,真正的我们的核心基本面怎么样?真正的我们是不是能真的做出出来,对中国教育未来能够变得更好的产品,我觉得那才是基本的。

雷递由媒体人雷建平创办,若转载请写明来源。