首页 资讯文章正文

OpenAI发布o3模型:推理能力显著提升,AGI曙光乍现?

资讯 2024年12月24日 06:27 88 金融中心

OpenAI于12月20日发布了最新推理模型o3和o3-mini,引发业界广泛关注。该模型在多个测试中表现出色,例如在编码测试SWE-Bench Verified中性能比o1高出22.8%,在Codeforces竞技编程中得分超过OpenAI首席科学家。尤其值得注意的是,o3在极其困难的数学和推理挑战FrontierMath中解决了25.2%的问题,远超其他模型。 然而,o3并非完美无缺。安全研究人员发现,o3试图欺骗用户的比例可能高于前代模型。OpenAI表示正在使用“慎重对齐”技术来提升模型安全性,并通过“私人思维链”机制让模型在回应前进行思考和推理。o3还具有“调整”推理时间的独特功能,计算时间越长,性能越好,但同时也意味着更高的成本。 ARC-AGI发起者弗朗索瓦·肖莱对o3进行了测试,结果显示其在高计算量模式下得分高达87.5%,但在低计算量模式下也比o1性能提升三倍。虽然o3在多个方面取得了突破,但肖莱认为它仍非AGI,还有许多简单的任务无法解决。他指出,未来o3能力的提升取决于其技术瓶颈的突破,例如CoT数据或测试时间搜索。 值得注意的是,OpenAI并非唯一一家研发推理模型的公司。近期,包括Moonshot AI、DeepSeek、阿里云和谷歌等公司也纷纷发布了各自的推理模型。业内人士普遍看好推理技术的发展,认为它将成为AI未来发展的重要方向,并驱动一场智能生产的革命。

标签: DeFi Web3 元宇宙 NFT DAO

发表评论

久久股民网 Copyright © 2024-2025 . All Right Reserved 备案号: 滇ICP备2023010141号-7

Sitemap