标题和作者

本文标题为《I put Google’s 24/7 AI assistant Gemini Spark to work, and it’s actually pretty useful》,作者来自TechCrunch。文章主要介绍了谷歌最新推出的全天候智能代理助手Gemini Spark,并详细记录了作者在实际使用该助手处理购物、旅行规划、资讯整理等日常数字生活任务过程中的体验、效果以及遇到的问题。

摘要

本文测试了谷歌推出的全新24/7全天候AI代理助手Gemini Spark。在之前的AI系统中,如OpenClaw,通常需要保持设备唤醒才能运行任务,而Gemini Spark运行在云端虚拟机(Cloud VMs)上,允许用户关闭笔记本电脑即可让AI继续工作,无需物理干预。为了验证其实用性,作者进行了包括寻找药妆店优惠、制定旅行打包清单、整理每周邮件摘要以及规划周末活动在内的多项测试。测试结果显示,Gemini Spark在发现折扣商品、提供详细的打包建议以及汇总本地活动信息方面表现出色,但在优惠券叠加使用失败、无法生成Google Keep便签、活动详情缺失(如费用和日期)以及链接跳转问题等方面存在一些小瑕疵。

此外,该助手目前主要局限于谷歌生态圈内的应用,且缺乏像短信或第三方预订服务(如Resy)的深度集成,这限制了其在处理非谷歌生态任务时的能力。本文还指出,将Spark作为一个独立的品牌进行推广可能会造成用户混淆,因为它本质上更像是Gemini的一个功能模块。

主要主题和概念

1. 云端虚拟机驱动的全天候代理

  • What:这是一种运行在云端虚拟机上的AI系统,旨在24/7全天候工作,而不需要用户保持设备开启。
  • Why:相比之下,之前的AI代理(如OpenClaw)需要本地设备持续运行才能执行任务,这对用户来说造成了负担。Gemini Spark的设计初衷是让用户能够“关闭笔记本电脑”,通过云端运行来处理数字事务。
  • How:该系统通过连接谷歌的各类生产力应用(如Gmail、Calendar等)来获取信息和执行指令,用户只需发出请求,系统即可在后台自动完成数据处理和整理工作。

2. 个人生产力聚合器

  • What:指利用AI自动收集、整理和汇总个人日常琐事信息的功能,例如购物清单、旅行建议、周末活动或邮件摘要。
  • Why:手动完成这些任务往往涉及大量的阅读、搜索和整理工作,例如需要浏览多个本地新闻网站、加入多个Facebook群组或阅读大量电子邮件,非常耗时且繁琐。
  • How:该功能通过结合网页搜索和用户个人的电子邮件搜索,利用关键词匹配来筛选相关信息,然后自动生成结构化的清单或摘要供用户参考,从而大幅减少了用户的手动操作时间。

重要引文

1. 优惠券与折扣的智能推荐

  • 论点:Gemini Spark能够有效帮助用户节省开支,通过推荐促销产品和叠加优惠券来实现。
  • 论据:在测试中,Spark为用户的Walgreens购物提供了具体的商品建议,并指出了哪些优惠券可以叠加使用。当在线取货且购买个人护理用品时,它甚至建议将在线促销代码与其他优惠组合以获得最大折扣。
  • 论证:尽管在尝试使用其中一个代码时遇到了失败的情况,但Spark随后通过引导用户寻找“买一送一”或“奖励”交易,成功弥补了这一损失,展示了其在处理交易细节时的实用价值。

2. 打包清单生成与工具选择的矛盾

  • 论点:Gemini Spark在提供内容建议方面非常精准,但在选择输出工具(如Google Keep)时存在严重缺陷。
  • 论据:在为一次短途旅行制定清单时,Spark准确地建议了防晒霜、水、雨伞等物品,并正确指出了活动场地禁止携带宠物。然而,当被要求将清单导入Google Keep时,它却无法执行此操作,而是错误地建议生成Google文档或起草电子邮件。
  • 论证:这种工具选择上的失误令人困惑,因为对于便签类任务,Google Keep是比文档或邮件更恰当的工具,这反映了该助手在处理特定任务时对谷歌生态应用的理解不够深入。

总结

Gemini Spark展现了作为一款24/7全天候AI代理的巨大潜力,特别是在处理谷歌生态内的任务时,它能够高效地整理信息、发现优惠并规划行程。作者通过亲身测试发现,它不仅能像人类一样幽默地发现诸如“Annual Beaver Queen Pageant”(年度海狸皇后选美比赛)这样的本地奇闻,还能在购物和打包等场景中提供切实可行的帮助。然而,该助手目前仍存在明显的短板:它缺乏Google Keep等关键应用的集成,无法直接通过iPhone硬件按钮访问,且在处理第三方预订(如餐厅或航班)时受限于MCP(模型上下文协议)的集成。最关键的是,作者认为将Spark作为独立品牌推广是不必要的,它更应作为Gemini的一个内置功能,以减少用户的认知负担,提供无缝的“提问即解决”体验。