Claude3发布直面GPT-4,AI对齐路线未来可期?

更新时间:2024-03-06 06:28:16作者:无忧百科

Claude3发布直面GPT-4,AI对齐路线未来可期?

【文/观察者网 唐晓甫】当地时间3月4日,著名AI大模型公司、被视作“OpenAI最大竞争对手”的Anthropic公司发布了其第三代Cluade大模型。根据其官网公布的信息,其中最强版本Claude 3 Opus已经在多个领域实现了对OpenAI和Google旗下最强AI:GPT-4和Gemini 1.0 Ultra的超越。

Claude 3是什么

Claude 3是Anthropic公司推出的第三代大模型。该公司由从OpenAI离职的前高级成员达里奥·阿莫代(Dario Amodei)和丹妮拉·阿莫代(Daniela Amodei)兄妹于2021年创立,前者曾任OpenAI研究副总裁,旗下主要研究人员也是由参与过OpenAI的GPT-2和GPT-3项目的前研究人员组成。


Claude 3的三个版本智能程度以及收费价格有明显区别 图片来源:Anthropic官网

根据本轮Anthropic公开数据显示,Claude 3包含三种模型:Claude 3 Haiku、Claude 3 Sonnet 和Claude 3 Opus。其中最强形态Claude 3 Opus已经实现在包括本科水平的大规模多任务语言理解 (MMLU)、研究生级别的Google验证问答 (GPQA)、小学基础数学 (GSM8K) 等多个方面对GPT-4和Gemini 1.0 Ultra的超越。



Claude 3与其他大模型对比 图片来源:Anthropic官网

同时在视觉处理方面,Cluade 3同样拥有极强的处理能力,可以处理包括包括照片、图表、图形和技术图表等。他们的AI在处理例如 PDF、流程图或幻灯片等带有格式编码的材料时,具有不错的处理能力。

在全面领先GPT-4的同时,相比于业界领先的Gemini 1.0 Ultra,Claude 3也能达到同等水平,甚至实现部分领域的反超。



Claude 3与其他大模型对比 图片来源:Anthropic官网

在长文本能力方面,Claude 3继承了Claude 2优秀的长文本能力。在发布时,三个模型都可以接受最多20万字的文本,并且该模型拥有最多记忆超过一百万个token的能力。同时其中最强的Claude 3 Opus对于文本内容的记忆提取准确率超过99%。



Claude 3拥有优秀的长文本能力 图片来源:Anthropic官网

虽然Claude 3并不是第一个达到这一指标的AI,但是其长文本的处理能力依旧处于全球大模型的第一梯队。(2月谷歌发布了Gemini 1.5 Pro。根据计划,该模型初期将可以支持100万个token,未来该模型理论上最多可以支持超过1000万个token。)

Anthropic对本次发布的Claude 3充满信心。其官方X账号表示,Claude 3系列模型“在推理、数学、编码、多语言理解和视觉方面树立了新的行业基准”。


Claude 3被其公司寄予厚望 图片来源:X

宪法AI:Anthropic对AI对齐边界又一次探索

此前,关于OpenAI的CEO山姆·奥特曼辞职一事以及背后的AI有效加速主义和AI对齐主义的发展路线之争引发全球关注。最终虽然该事件以奥特曼回归OpenAI结束,但是这也引发了OpenAI公司内部相关制度调整,并对全球AI发展造成了一些影响。Claude 3在这方面似乎走在前列。

长期以来关于AI发展有两派观点,即有效加速主义和AI对齐思想。

有效加速主义(Effective accelerationism,简称为“e/acc”)是一种21世纪基于科技发展而兴起的哲学思想。其支持者一般认为,由人工智能驱动的进步是一种伟大的社会平等器,应该被推动前进。因此,不惜一切代价,采用包括加速商业化在内的一切手段,推动技术进步才是唯一在道德上合理的行动方针。值得注意的是,一般认为OpenAI的现任CEO山姆·奥特曼(Sam Altman)是有效加速主义的支持者。

与有效加速主义对应的是AI对齐(AI alignment)思想,该派理论则更注重AI安全问题,强调人工智能系统的对齐问题,即如何确保未来超出人类智能的超级人工智能系统的行动目标与人类的目标一致。因为如果人工智能系统的目标与人类的目标不一致,可能会导致不可预见和潜在的危险后果。


Claude 3和GPT-4 图片来源:视觉中国

回顾Anthropic的发展史,我们会发现,公司创始人达里奥·阿莫代等人都是AI对齐思想的支持者。这批人当初脱离OpenAI的部分原因就是,其与持有效加速主义的奥特曼在发展AI的理念上有一定冲突。

早在2022年12月,在著名学术论文预印本网站arXiv上就出现了一篇论文:“宪法人工智能:人工智能反馈的无害性”(“Constitutional AI: Harmlessness from AI Feedback”)。该论文强调为AI制定一个“宪法”,以实现AI发展与人类价值观一致,并且确保其是无害的、有益且诚实的。

在Anthropic去年10月发布的文章“集体宪法人工智能:使语言模型与公众意见保持一致”(“Collective Constitutional AI: Aligning a Language Model with Public Input”)中,Anthropic公司表示,语言模型Claude目前依赖于Anthropic员工制定的宪法。该宪法的灵感来自于包括《联合国世界人权宣言》等外部来源,以及公司训练时与该大语言模型互动的第一手经验。这些训练可以使其公司旗下的AI更加有用且无害。

该公司文件显示,AI宪法共有58条,其中大约有50%的概念与价值观人类价值观和公共宪法重合。这58条宪法包括,要求AI选择最支持自由、平等、兄弟情的回答;选择最不种族主义、性别歧视、以及最少歧视性的回答等。

AI对齐的追求曾引发部分人士担心可能导致AI性能下降,而Claude 3的突破无疑为AI对齐的未来发展奠定了一个更高的基础。

背靠金主,未来发展可期

虽然Anthropic公司的创始人们在2021年因为微软投资OpenAI而离职,但是其并没有拒绝来自其他财团的大规模资金投入。

根据《纽约时报》2024年2月20日报道,2023年5月,其从谷歌和Salesforce等投资者处拿到了4.5亿美元的投资,这是之后一年融资狂潮的开始。

8月,其从两家亚洲电信公司获得1亿美元投资。随后亚马逊向其投入了40亿美元,谷歌随后又投入了20亿美元。

今年2月风险投资公司Menlo Ventures继续向Anthropic投资7.5亿美元。这使得其一年内获得了73亿美元的融资。

这些融资使得这家初创公司的估值增加了两倍,达到150亿美元。而根据两位知情人士爆料,该公司2023年的月收入约为800万美元,预计这一收入将在2024年增长八倍左右。

高昂的投入意味着美国本轮AI大模型发展的格局正在清晰,而Claude系列模型似乎已经脱颖而出,未来可能成为美国AI大模型军备竞赛最后的胜利者之一。

本文系观察者网独家稿件,未经授权,不得转载。

本文标签: AI  宪法  gpt-4  claude