OpenAI发布o3模型：推理能力显著提升，AGI曙光乍现？

资讯 2024年12月24日 06:27 88 金融中心

OpenAI于12月20日发布了最新推理模型o3和o3-mini，引发业界广泛关注。该模型在多个测试中表现出色，例如在编码测试SWE-Bench Verified中性能比o1高出22.8%，在Codeforces竞技编程中得分超过OpenAI首席科学家。尤其值得注意的是，o3在极其困难的数学和推理挑战FrontierMath中解决了25.2%的问题，远超其他模型。然而，o3并非完美无缺。安全研究人员发现，o3试图欺骗用户的比例可能高于前代模型。OpenAI表示正在使用“慎重对齐”技术来提升模型安全性，并通过“私人思维链”机制让模型在回应前进行思考和推理。o3还具有“调整”推理时间的独特功能，计算时间越长，性能越好，但同时也意味着更高的成本。 ARC-AGI发起者弗朗索瓦·肖莱对o3进行了测试，结果显示其在高计算量模式下得分高达87.5%，但在低计算量模式下也比o1性能提升三倍。虽然o3在多个方面取得了突破，但肖莱认为它仍非AGI，还有许多简单的任务无法解决。他指出，未来o3能力的提升取决于其技术瓶颈的突破，例如CoT数据或测试时间搜索。值得注意的是，OpenAI并非唯一一家研发推理模型的公司。近期，包括Moonshot AI、DeepSeek、阿里云和谷歌等公司也纷纷发布了各自的推理模型。业内人士普遍看好推理技术的发展，认为它将成为AI未来发展的重要方向，并驱动一场智能生产的革命。

标签： DeFi Web3 元宇宙 NFT DAO