...
...

隐藏系统提示曝光Claude 4运行机制,Anthropic严格控管AI行为

AI研究者Simon Willison通过分析泄露的Claude 4系统提示,揭示了Anthropic如何用隐藏指令控制其AI模型的行为与输出。这些指令包括禁止奉承语言、避免自毁倾向、限制列表使用、以及严格遵守版权规定(如每次仅可引用15词以内内容、禁止生成歌词等)。尽管Anthropic曾公布部分系统提示,但完整内容仍依赖“提示注入”技术才能获得。Willison指出,这些提示实际反映了模型曾经出错的历史,也是理解Claude性能边界与使用方法的关键。他呼吁厂商应更加透明,公开完整提示信息,帮助用户高效利用AI工具。