标题和作者

本文档标题为“Token贵只因你喂给模型的垃圾太多了丨@亚马逊王晓野AIGC2026”,作者为亚马逊云科技产品技术部技术总监王晓野。文档主要围绕在2026中国AIGC产业峰会上,探讨如何将个人级的AI Agent(俗称“养龙虾”)从Demo阶段跨越到企业级生产环境,解决企业面临的模型选择、构建复杂度、使用门槛及人才缺口等四大鸿沟问题,并提出了一套包含算力、模型、数据、Agentic平台和Agent应用五大层的落地框架,旨在帮助企业真正实现AI价值。

摘要

本文由亚马逊云科技王晓野在2026中国AIGC产业峰会上分享,主要探讨了AI Agent从个人演示走向企业生产环境的挑战与解决方案。此前已有大量企业宣称部署AI,但仅约10%真正获得价值,主要原因是个人“养龙虾”与企业级Agent在工程复杂度、稳定性、安全性和数据管理上的巨大差异。本文提出了解决四大鸿沟的方法,构建了包含算力、模型、数据、平台和应用五大层的架构,并特别强调了“Harness”这一生产级控制层的重要性,指出Token昂贵往往是因为喂入了过多无用信息。此外,还介绍了与OpenAI的联合发布及Quick等应用实例。本节中提到的“养龙虾”是个人用户在本地运行自主性Agent的通俗说法,与企业级Agent的分布式、安全运行形成对比;“Harness”是指在大模型之外,用于控制、管理和约束Agent行为的底层架构,类似于电脑的操作系统而非单纯的CPU;“AI-ready数据平台”是指专门为AI Agent设计的、能够处理记忆隔离、生命周期管理和高效调用数据的数据基础设施。

主要主题和概念

主题一:个人Agent与企业级Agent的本质差异

  • What:界定问题为个人随意配置的Agent(如Mac mini上的Demo)与企业需要安全、稳定、大规模运行的Agent之间的鸿沟。
  • Why:分析原因在于个人环境可随时重启,而企业环境涉及数千个Agent的并发、数据安全和业务连续性,工程复杂度呈指数级上升。
  • How:通过建立五大能力层(算力、模型、数据、平台、应用)和引入“Harness”概念,提供生产级所需的自动化扩展、记忆管理和安全策略。
    本节中提到的“养龙虾”是文中借指个人用户利用Agent工具在本地进行探索和测试的现象,这种环境灵活但不可靠;“Harness”即Harnessing,意为驾驭或管理,在此处指代一套能够管理AI Agent行为、数据流和系统交互的工程体系,确保AI像传统软件一样可控;“Working Agent”是指能够深度参与用户日常工作流程、不仅提供信息还能执行具体任务的智能体,区别于仅提供信息的编码助手。

主题二:Token成本与数据质量的关系

  • What:界定Token成本高企并非单价问题,而是输入给模型的信息质量低、冗余过多的问题。
  • Why:分析原因在于Agent在处理任务时,如果记忆管理不当或未优化输入,会将大量无关或错误信息喂给模型,导致资源浪费。
  • How:通过构建AI-ready的数据平台,实施记忆的生命周期管理、隔离与共享机制,以及全链路可观测性,优化喂给模型的数据源。
    本节中提到的“养龙虾”是文中借指个人用户利用Agent工具在本地进行探索和测试的现象,这种环境灵活但不可靠;“Harness”即Harnessing,意为驾驭或管理,在此处指代一套能够管理AI Agent行为、数据流和系统交互的工程体系,确保AI像传统软件一样可控;“Working Agent”是指能够深度参与用户日常工作流程、不仅提供信息还能执行具体任务的智能体,区别于仅提供信息的编码助手。

主题三:Harness作为生产级AI的操作系统

  • What:界定Harness是指除了大模型能力外,用于让Agent具备执行能力、连接系统和管控能力的生产级框架。
  • Why:分析原因在于单纯的大模型无法直接用于生产,它需要配套的Runtime、Gateway、Policy等基础设施来处理安全、可靠性和集成问题。
  • How:利用Amazon Bedrock AgentCore等工具,集成LangChain等开源框架,提供自动横向扩展、代码解释器、身份认证和策略评估等功能。
    本节中提到的“养龙虾”是文中借指个人用户利用Agent工具在本地进行探索和测试的现象,这种环境灵活但不可靠;“Harness”即Harnessing,意为驾驭或管理,在此处指代一套能够管理AI Agent行为、数据流和系统交互的工程体系,确保AI像传统软件一样可控;“Working Agent”是指能够深度参与用户日常工作流程、不仅提供信息还能执行具体任务的智能体,区别于仅提供信息的编码助手。

重要引文

论点:个人养龙虾和企业养龙虾完全是两件事。
论据:文中指出个人环境配置后很少改动,而企业环境需要让几千个Agent安全、可信、不中断地运行。
论证:通过对比个人Mac mini上Agent的随时拔电源重启与企业分布式环境对稳定性和数据安全的严格要求,论证了从Demo到生产跨越的巨大工程难度。
本节中提到的“养龙虾”在文中特指个人用户在本地运行自主性Agent的轻松体验,与企业的重工程形成对比。

总结

本文最吸引眼球的观点在于指出“Token贵”并非单价问题,而是因为喂给了模型过多垃圾信息,强调了数据质量和记忆管理的重要性。核心价值在于提出了从Demo走向生产的“五大能力层”架构,特别是将大模型之外的“Harness”视为关键。结合与OpenAI的联合发布及Quick等工具的介绍,展示了如何通过开放的平台和智能的助手应用,解决企业级Agent落地的痛点。未来随着15%的企业决策将由Agent自主完成,如何构建高效的AI-ready数据平台和生产级Harness将成为关键。