ai-safetysecurityapi

快速精准的提示词注入检测 API

2026年4月10日7 min 阅读

Agent 会接触用户输入、网页内容、评论文本和第三方数据。任何一个输入源都可能包含“忽略之前指令”这类 prompt injection。

防护的关键是把检测放在工具调用链路里，而不是只靠模型自觉。MartCore 的安全接口可以在请求进入 Agent 之前给出风险分数和标签。

在生产环境中，建议对网页抓取结果、评论正文、用户上传内容和自动化任务 prompt 做统一检测。