谷歌最新Gemini 2.5 Flash模型安全测试得分不如前代@feaOS

谷歌最新Gemini 2.5 Flash模型安全测试得分不如前代

2025年05月03日来源：techcrunch 人工智能

谷歌本周发布的技术报告显示，其最新的Gemini 2.5 Flash AI模型在安全测试中的表现比Gemini 2.0 Flash更差，在“文本到文本安全”和“图像到文本安全”两项指标上分别退步4.1%和9.6%，意味着它更容易生成违反公司安全政策的内容。报告指出，新模型在遵循用户指令时表现更积极，但因此在面对敏感话题时也更容易越界。谷歌称部分回退是因误报，但也承认在明确请求下模型会生成违规内容。专家批评谷歌在报告中未提供足够细节，增加了外界独立评估的难度。目前，随着OpenAI、Meta等同行调整AI模型以更少拒答争议话题，业界对于模型安全与指令遵循之间的平衡问题正引发更大关注。

推荐内容

[较早]扎克伯格开出年薪1亿美元：Meta高价挖角AI人才引发行业震动

[较早]AI带动能源需求飙升，科技巨头纷纷投资核裂变初创公司

[较早]Meta再挖OpenAI两位核心研究员加速超级智能实验室布局

[较早]OpenAI与谷歌Meta科学家警告：AI“思维链”正变得难以追踪