隐藏系统提示曝光Claude 4运行机制，Anthropic严格控管AI行为

2025年05月28日来源：techcrunch分类：人工智能

AI研究者Simon Willison通过分析泄露的Claude 4系统提示，揭示了Anthropic如何用隐藏指令控制其AI模型的行为与输出。这些指令包括禁止奉承语言、避免自毁倾向、限制列表使用、以及严格遵守版权规定（如每次仅可引用15词以内内容、禁止生成歌词等）。尽管Anthropic曾公布部分系统提示，但完整内容仍依赖“提示注入”技术才能获得。Willison指出，这些提示实际反映了模型曾经出错的历史，也是理解Claude性能边界与使用方法的关键。他呼吁厂商应更加透明，公开完整提示信息，帮助用户高效利用AI工具。

支持率<5%