OpenAI承诺更频繁公开AI安全评估结果，回应外界质疑@feaOS

OpenAI承诺更频繁公开AI安全评估结果，回应外界质疑

2025年05月15日来源：techcrunch 人工智能

为回应关于AI安全测试透明度的争议，OpenAI宣布推出“安全评估中心”，将定期公布其AI模型在生成有害内容、被越狱（jailbreak）及产生幻觉方面的测试结果。该中心将随着重大模型更新持续更新。此前，OpenAI因缺乏技术报告、模型上线前安全测试不足，以及GPT-4o模型出现“过度认同用户错误言论”等问题而受到批评。OpenAI表示，未来将引入“alpha测试阶段”让用户提前体验模型并反馈，以提高安全性和可信度。

推荐内容

[较早]OpenAI推出安全评估中心提高AI幻觉率与有害内容透明度

[较早]OpenAI紧急回滚GPT-4o更新，因用户吐槽“太舔太怪”

[近日]OpenAI在用户大规模抗议后恢复GPT-4o并提升订阅额度

[近日]GPT5上线引发用户强烈不满OpenAI紧急恢复旧模型