OpenAI承诺更频繁公开AI安全评估结果,回应外界质疑
2025年05月15日
来源:techcrunch
人工智能
为回应关于AI安全测试透明度的争议,OpenAI宣布推出“安全评估中心”,将定期公布其AI模型在生成有害内容、被越狱(jailbreak)及产生幻觉方面的测试结果。该中心将随着重大模型更新持续更新。此前,OpenAI因缺乏技术报告、模型上线前安全测试不足,以及GPT-4o模型出现“过度认同用户错误言论”等问题而受到批评。OpenAI表示,未来将引入“alpha测试阶段”让用户提前体验模型并反馈,以提高安全性和可信度。