OpenAI的o3模型在ARC-AGI基准测试中取得了85%的得分,超过了先前的AI最佳成绩55%,并与人类平均得分持平。此测试旨在衡量AI系统的“样本效率”,即AI系统在面对新情况时所需的示例数量。OpenAI的这一突破标志着通用人工智能(AGI)的目标取得了重要进展。尽管外界仍存怀疑,但许多AI研究者认为,AGI的实现正变得更加迫切和现实。
[较早]OpenAI的o3模型展示了AI扩展的新方式,但成本也随之上升
[较早]OpenAI发布o3模型,宣称接近AGI
[近日]DeepMind发布Genie 3世界模型,迈向AGI关键一步
[较早]OpenAI或于八月发布GPT-5,整合推理与通用语言能力