AI 编程挑战首轮结果出炉：冠军仅答对 7.5%@feaOS

AI 编程挑战首轮结果出炉：冠军仅答对 7.5%

2025年07月24日来源：techcrunch 人工智能

大多数支持

由Databricks与Perplexity联合创始人Andy Konwinski发起的AI编程挑战“K Prize”公布首轮结果，冠军仅答对7.5%的题目，引发业界震惊。这项挑战旨在提供一个“无污染”的AI评估平台，回避已有数据训练的干扰，要求参赛模型基于新GitHub问题作答，不能事先训练。首轮优胜者为来自巴西的提示工程师Eduardo Rocha de Andrade，获得5万美元奖金。相比之下，SWE-Bench等旧有测试平台的AI正确率高达75%，但真实性受到质疑。Konwinski表示，该赛事支持小型开源模型，并承诺100万美元奖励给首个突破90%正确率的开源模型。这场挑战不仅是一场技术竞赛，更是对当前AI能力“吹捧泡沫”的一次现实检验。

推荐内容

[较早]Databricks与Perplexity联合创始人出资1亿美元推动AI公益研究

[近日]谷歌借AI反击对手搜索量激增反成增长引擎

[近日]Proton发布Lumo隐私型AI助手：聊天加密、无日志、无需账号

[最近]ChatGPT竞品CEO：AI将在六个月内取代招聘和助理岗位