谷歌本周发布的技术报告显示,其最新的Gemini 2.5 Flash AI模型在安全测试中的表现比Gemini 2.0 Flash更差,在“文本到文本安全”和“图像到文本安全”两项指标上分别退步4.1%和9.6%,意味着它更容易生成违反公司安全政策的内容。报告指出,新模型在遵循用户指令时表现更积极,但因此在面对敏感话题时也更容易越界。谷歌称部分回退是因误报,但也承认在明确请求下模型会生成违规内容。专家批评谷歌在报告中未提供足够细节,增加了外界独立评估的难度。目前,随着OpenAI、Meta等同行调整AI模型以更少拒答争议话题,业界对于模型安全与指令遵循之间的平衡问题正引发更大关注。