游戏盾可以自动防御各种攻击吗
2026/1/13 22:21:35
根据对国内大模型安全事故的梳理,提示词攻击已从理论威胁演变为可造成真实业务中断、数据泄露甚至系统控制的高频风险。这类攻击的核心是构造特定的输入(提示词),绕过或操纵大模型的安全机制,使其执行非预期的有害操作。
下面是几个具有代表性的国内安全事故案例汇总,可以帮你快速了解基本情况。
| 事件名称 | 发生时间/报告时间 | 攻击方式 | 具体经过 | 主要影响与风险 | 根本原因 |
|---|---|---|---|---|---|
| 金融/医疗“Prompt误喂”事件 | 2025年(报道时间) | 间接提示词注入、数据泄露 | 员工将包含客户身份证号、病史等完整字段的文本粘贴至对话中。模型在后续回答时,将这些敏感片段完整输出,被外部合作方的爬虫程序截获。 | 敏感数据泄露,直接侵犯用户隐 |