蚂蚁数科发布“龙虾卫士”，护航OpenClaw智能体安全落地

标题和作者

标题：蚂蚁数科发布“龙虾卫士”，护航OpenClaw智能体安全落地。作者：量子位的朋友们。背景：文章主要介绍了蚂蚁数科在AI智能体安全领域的最新布局，推出了名为“龙虾卫士”的防护体系，旨在解决OpenClaw等智能体带来的安全挑战。主题聚焦于AI智能体的安全风险治理与防护方案。

摘要

本文介绍了蚂蚁数科推出“龙虾卫士”AI安全防护体系。此前，AI智能体（如OpenClaw）虽然提升了生产力，但也带来了权限越界、记忆污染等风险，部分企业低估了治理挑战。本文需要做是因为现有安全手段难以应对这些新风险。具体做法是通过“claw安全套件1点0版本”实现三大核心能力：一是对抗思想变异，防止模型被“黑化”；二是净化skills仓库，阻断权限越界和敏感泄露；三是风险舆情播报，实现主动应对。效果方面，技术达到金融合规等场景的SOTA（最佳技术水平）效果，具备0-Day（0日）泛化修复风险能力，并入选IDC《中国大模型安全市场图谱》。
术语解释：OpenClaw是一种自主执行型AI智能体，具有强大的系统访问与任务执行能力，但同时也带来了权限越界等安全风险。CALIR是蚂蚁数科提出的五维模型框架，用于对Skills插件进行合规扫描与行为审计。SOTA代表State Of The Art，即最佳技术水平。0-Day指未公开或未修复的漏洞，文章提到的0-Day泛化修复能力意味着该技术可以应对未知的漏洞类型。

主要主题和概念

主题一：AI智能体面临的安全风险。What是问题，即自主执行型AI在带来效率提升的同时，带来了权限越界、记忆污染、恶意诱导、算力滥用等前所未有的安全风险。Why是分析，即部分企业在拥抱效率时低估了潜在治理挑战，导致安全漏洞频发。How是解决，即需要构建全生命周期、多层次的安全保障体系，如“龙虾卫士”。
主题二：claw安全套件1点0版本的核心能力。What是问题界定，即针对AI智能体的输入输出内容、Skills插件仓库以及安全态势进行防护。Why是分析，即为了防止模型被“黑化”、阻断权限越界和敏感数据泄露，并将被动防御转化为主动应对。How是解决，通过精准识别违规信息、基于CALIR模型扫描审计插件、生成实时风险报告并主动推送来实现。
主题三：CALIR五维模型框架。What是问题界定，这是一个用于Skills插件合规扫描与行为审计的模型框架。Why是分析，因为Skills插件是AI智能体执行任务的关键组件，存在权限越界和异常调用的风险。How是解决，利用该框架对插件进行深度扫描和行为审计，有效识别并阻断违规操作。
术语解释：Skills在AI智能体领域通常指插件或工具包，是智能体执行特定任务（如调用数据库、操作文件）的模块。思想变异在本文中指模型被恶意诱导或“黑化”，即原本合规的AI模型被输入特定信息后产生违背预设目标的输出。

重要引文

论点：AI智能体不是“黑箱”，更不能是“盲盒”，必须拥有可解释、可控制、可追溯的安全基石。论据：AI智能体拥有强大的系统访问与任务执行能力，带来了权限越界、记忆污染、恶意诱导等风险。论证：蚂蚁数科推出的“龙虾卫士”正是为了解决这些风险，确保企业在享受AI红利时拥有安全可控的基石。
论点：蚂蚁数科的大模型安全技术具备领先实力。论据：基于真实场景攻防经验，技术已达到金融合规、越狱攻击等复杂场景的SOTA效果，并具备0-Day泛化修复风险能力，同时入选IDC《中国大模型安全市场图谱》。论证：通过推出“claw安全套件1点0版本”和启动“龙虾AI安全守护计划”，蚂蚁数科验证了其技术在实际场景中的有效性。
术语解释：“黑箱”指内部结构不透明的系统，无法解释其决策过程。在AI领域，这指无法解释的决策逻辑。“盲盒”指结果不可预测的未知事物。在AI安全中，指智能体行为不可控，可能产生意想不到的负面后果。

总结

本文最吸引人的部分是蚂蚁数科推出的“龙虾卫士”AI安全防护体系及配套的“龙虾AI安全守护计划”。除了提供三大核心防护能力外，该计划还面向首批100家合作企业提供为期3个月、总计20万次的免费安全防护调用服务，极大地降低了企业部署安全基线的门槛。这不仅体现了蚂蚁数科在金融合规、越狱攻击等复杂场景中达到SOTA（最佳技术水平）的技术实力，更展示了其具备应对0-Day（0日）未知漏洞的泛化修复能力。通过这一方案，蚂蚁数科致力于让AI智能体从不可控的“盲盒”转变为可解释、可追溯的“安全基石”，为企业在享受AI红利的同时提供了坚实的护盾。