科大讯飞刘庆峰:中美通用大模型差距在半年到一年半,如果不做闭源,开源也做不到最好

更新时间:2024-04-24 05:26:14作者:无忧百科

科大讯飞刘庆峰:中美通用大模型差距在半年到一年半,如果不做闭源,开源也做不到最好

“当通用底座能力能紧紧跟上的时候,行业就有机会实现超越。”

4月23日,科大讯飞股份有限公司(科大讯飞,002230)举行业绩说明会。科大讯飞董事长刘庆峰在业绩会上对于今年一季度亏损扩大表示,公司继续加大了研发投入,同时也同步加大了市场投入,另外公司持有的三人行、寒武纪、商汤这些股票,“我们为了打大模型的仗在合适时间已经全部清仓了,去年一季度有的资产增值今年就没有了”。

前一天(4月22日)晚间,科大讯飞公布了去年及今年一季度业绩。2023年实现营收196.5亿元,同比(较去年同期)增长4.41%;归属于上市公司股东的净利润6.57亿元,同比增长17.12%;扣非(扣除非经常性损益)后净利润1.18亿元,同比减少71.74%。2024年一季度营收36.46亿元,同比增长26.27%;归属于上市公司股东的净利润亏损3亿元,上年同期为亏损5789.53万元,同比扩大418.99%;扣非后净利润亏损4.4亿元,上年同期为亏损3.38亿元,同比扩大30.29%。

截至4月23日收盘,科大讯飞股价报收41.97元/股,跌5.22%。

一季报显示,科大讯飞一季度毛利率为38.06%,同比下降3.82个百分点。对此,刘庆峰表示是因为一些特殊的阶段性确认原因,“全年毛利率应该比一季度毛利率要高,总体来看毛利率保持稳定,不是因为市场竞争变激烈了,我们把价格降低了从而导致毛利率下降”。

科大讯飞在年报中表示,将持续提升讯飞星火通用底座核心能力,预计在上半年对标GPT-4turbo当前最好水平,下半年对标GPT-4V和DALL-E3当前最好水平。

刘庆峰在业绩会上表示:“GPT也在不断进步,我们一直在跟踪它更新的效果,我们非常有信心在今年6月能够对标GPT-4……赶上GPT-4是现在的水平,可GPT-5一发,我们的差距会被拉到一年,我们还要有个追赶的过程。”

他认为,中美之间在大模型底座能力上的差距,在半年到一年半之间。“这会是个动态追赶,但不会被彻底甩开。当通用底座能力能紧紧跟上的时候,行业就有机会实现超越,有能够对标GPT-4,而且有雄心追赶GPT-5的通用底座,我们在未来又会越追越近。”刘庆峰表示。

对于美国对于芯片的限制,刘庆峰表示:“我们在中国率先做国产算力,我们蹚的很多水,吃的很多苦,大家可能都得走一遍……这时国产算力的比较优势反而表现出来了。”

刘庆峰称,一万张卡(芯片)对于科大讯飞而言还不够,还要在投入可控的范围下去补算力,“算力有,我们还有很多活要干。但我们还是要增加算力,现在有点韩信将兵多多益善的感觉,不是说拿着它不知道怎么做。”

刘庆峰强调,通用人工智能可以根本改变产业形态和竞争格局,中美在未来一定是会竞争的。如果没有通用大模型,只做行业模型,只做应用场景,每一次大模型底座升级,很多行业辛辛苦苦积累的优势马上就会被清零,就像Sora一发布,很多独角兽、优秀的创业公司直接被清零了。

他认为,大模型研发的典型是“大平台+英雄主义”。核心是要有大算力,有成建制的团队和技术基础,并不是说堆的人越多越好。“我们今年重点要招聘高潜的应届毕业生、博士生、研究生,作为未来的骨干。可以看到,无论是Sora还是ChatGPT,很多都还是刚刚大学毕业的年轻人干出来的。”刘庆峰表示。

而对于“百模大战”,刘庆峰认为,很多榜单鱼龙混杂,各维度能力比重没有权威标准,但国家已经越来越关注,一些更权威的行业指导测试方法将会推出。

大模型的第三方赋能方面,刘庆峰称这需要耐心和时间,“如果直接想把大模型几千万几个亿就卖出去,我觉得过于急功近利了,可能反而欲速则不达,但我相信今年在行业赋能上,在新的行业和新的企业端,还是会有非常好的新增收益”。

对于一直备受争论的开源闭源,刘庆峰表示:“实际上这两块是相互补充的。”他以星火开源13B模型为例指出,等650亿、1500亿、1750亿参数以及更大模型出来,每一个更大的模型做出来,我们就知道了它的天花板和边界,再对它进行裁剪、浓缩,就变成13B,那13B的效果也提升了。所以如果不做闭源,不探索行业最高的天花板,开源也做不到最好。

刘庆峰表示,科大讯飞的核心研发平台在去年底做了一次梳理,几乎所有方向上的AI研究,在未来一两年内都要基于大模型逻辑再重写,上个大台阶。但上大台阶的同时,要研究蒸馏减脂的方法,把它变成13B甚至更小的模型,能装到手机、智能家居、汽车上。