由Databricks与Perplexity联合创始人Andy Konwinski发起的AI编程挑战“K Prize”公布首轮结果,冠军仅答对7.5%的题目,引发业界震惊。这项挑战旨在提供一个“无污染”的AI评估平台,回避已有数据训练的干扰,要求参赛模型基于新GitHub问题作答,不能事先训练。首轮优胜者为来自巴西的提示工程师Eduardo Rocha de Andrade,获得5万美元奖金。相比之下,SWE-Bench等旧有测试平台的AI正确率高达75%,但真实性受到质疑。Konwinski表示,该赛事支持小型开源模型,并承诺100万美元奖励给首个突破90%正确率的开源模型。这场挑战不仅是一场技术竞赛,更是对当前AI能力“吹捧泡沫”的一次现实检验。