本文作者李丹为我们带来了关于人工智能巨头之间一场精彩推理模型攻防战的详细报道。谷歌与OpenAI在这场交锋中,各自展示了自家的先进推理模型。谷歌刚发布自家的先进推理模型挑战OpenAI的o1,而OpenAI则迅速回应,推出了升级版的最强推理模型o3。
在OpenAI的线上新品发布活动的最后一天,即美东时间12月20日周五,OpenAI宣布了他们的“压轴大作”:o1的下一代模型o3。此次发布,OpenAI不仅推出了正式的o3,还推出了一个相对较小的精简版o3-mini。
OpenAI的CEO Sam Altman在直播中提到,此次活动首尾由介绍推理模型呼应,也算是一种精心设计。逻辑上说,o1的下一代应该命名为o2,但新模型叫o3,可能是为了避免和名为O2的英国电信服务商冲突。
o3在软件工程、编写代码,还是竞赛数学、掌握人类博士级别的自然科学知识能力方面,都明显高出o1一筹。同时测试显示,o3在OpenAI实现通用人工智能(AGI)这一奋斗目标上取得了突破,最高的测试成绩达到了类人水平。
在软件工程测试中,o3的准确率比o1高近47%;在竞赛数学方面,o3的准确率比o1高15%;在人类博士专家级生化物知识方面,o3的准确率比o1高近13%。此外,o3的推理能力已经更加接近实现AGI,在名为ARC-AGI的测试中,o3的最佳成绩超过了标志着达到人类水平的门槛85%。
虽然o3的测评看上去表现惊艳,但OpenAI应该不会很快面向大众上线这款新的超级推理模型。OpenAI的一名发言人本周五称,OpenAI计划明年初正式发布这些新的o3模型。同时,Altman也暗示,o3系列可能在一段时间内都不会向普通大众推广使用。
在这场人工智能巨头的较量中,我们看到了OpenAI与谷歌在人工智能领域的技术进步和竞争。OpenAI的o3模型在多个方面展现出强大的推理能力,为人工智能领域的发展提供了新的可能性。我们期待看到未来更多关于人工智能技术的创新和突破。
转载请注明来自中天华康,本文标题:《超级推理模型对决,谷歌o1VS OpenAI o3》