标题和作者
本文主要介绍了 DoorDash 公司发布了一款名为 "Tasks" 的独立应用程序以及 Dasher 应用程序中的新任务功能,旨在通过向配送员支付报酬,让他们通过提交视频、照片和音频数据来帮助训练人工智能和机器人系统。文章引用了 Bloomberg、TechCrunch 和 DoorDash 官方博客的信息,详细阐述了该应用的运作模式、具体的任务类型、与 Waymo 等合作伙伴的合作情况,以及该模式对零工经济和数据标注领域的影响。
摘要
DoorDash 最近推出了一款名为 "Tasks" 的独立应用程序以及 Dasher 应用程序中的新任务功能,旨在向配送员支付报酬,让他们通过提交视频、照片和音频数据来帮助训练人工智能和机器人系统。在此之前,Uber 等公司已经尝试过让司机参与数据标注工作,而 DoorDash 的这一举措延续了这一趋势,但规模更大。本文之所以需要做这项工作,是因为公司希望通过 800 多万名 Dashers(配送员)覆盖全美各地的独特能力,将物理世界数字化,从而收集宝贵的真实世界数据,帮助其内部模型及零售、保险、科技等合作伙伴开发更先进的 AI。具体做法是,配送员可以在 Dasher 应用或独立 Tasks 应用中查看任务,例如拍摄双手洗五个盘子的过程、拍摄酒店入口以便定位,或者帮助 Waymo 自动驾驶汽车关上门。DoorDash 还承诺费用透明,根据任务的努力程度和复杂性预先显示报酬。为了让不了解领域的读者理解,这里需要解释几个关键术语:Dashers 是 DoorDash 的配送员昵称;Waymo 是一家专注于自动驾驶技术的公司,DoorDash 的合作任务涉及协助关闭其自动驾驶汽车的车门;AI 和机器人系统 指的是利用人工智能算法来模拟人类行为或自主运行的机器系统,这些系统需要真实的物理世界数据(如烹饪、说话、关门)来学习如何更好地理解环境。
主要主题和概念
概念一:物理世界的数据采集
- What:指通过人工手段收集现实世界中的具体行为数据,例如拍摄双手清洗餐具的过程、录制外语对话或拍摄餐厅菜单图片,以便为计算机系统提供真实的视觉和听觉参考。
- Why:现有的计算机视觉和语音识别技术往往依赖模拟数据或静态图片,难以完全理解物理世界的复杂性和动态性,因此需要通过人类在真实场景中的行为数据来训练 AI 模型,使其更准确地理解和模拟物理交互。
- How:DoorDash 利用其庞大的配送员网络,通过 "Tasks" 应用将这些数据采集任务分配给员工,让 Dashers 在完成配送工作的间隙或特定时段,通过手机摄像头和录音设备采集这些数据。
概念二:双平台任务生态系统
- What:DoorDash 建立了一个包含独立应用程序和现有应用程序内功能的双重任务交付系统,旨在提供更灵活的服务模式。
- Why:将任务分为独立应用和现有应用内列表,可以满足不同场景的需求。例如,一些任务可能需要专门的设备或更长的专注时间,独立应用能提供更好的用户体验;而一些简单任务则可以直接嵌入现有的 Dasher 应用中,方便配送员随时接单。
- How:配送员既可以在主 Dasher 应用中看到新的数字 "Tasks"(如拍摄酒店入口),也可以下载并使用独立的 "Tasks" 应用来处理更复杂的任务(如录制语言样本或操作身体摄像机)。
概念四:零工经济在数据标注中的应用
- What:指利用零工经济模式(即自由职业者或兼职工作者)来完成原本可能需要全职员工或专业机构才能完成的数据标注或收集工作。
- Why:相比于组建庞大的内部团队,利用现有的庞大劳动力(如 Uber 司机和 DoorDash 配送员)进行数据收集可以极大地降低成本、提高效率,并且能够利用这些劳动力已经在特定区域分布的优势,快速覆盖广泛的地域。
- How:平台通过建立明确的报酬机制,将具体的任务(如上传照片、录制视频)转化为可计量的收入来源,激励工人在完成本职工作之外,利用空闲时间赚取额外收入,从而实现数据采集的规模化。
为了更好地理解上述内容,需要解释 数据标注 这一概念,它是机器学习中的关键步骤,指人工将图片、音频或视频中的特定特征标记出来,告诉计算机这些特征是什么。零工经济 则是指一种灵活的就业模式,劳动者通过平台按单计酬,不需要长期雇佣关系。DoorDash 的模式正是利用了这种灵活性,让配送员在送餐之余成为 AI 的“数据采集员”。
重要引文
论点一:DoorDash 希望利用其庞大的配送员网络,将物理世界数字化,并为配送员提供新的赚钱方式。
论据:DoorDash 的总经理 Ethan Beatty 在博客中提到:“DoorDash 有超过 800 万名 Dashers,他们可以到达美国几乎任何地方,并且希望在配送之外灵活地赚钱。这是数字化物理世界的强大能力。”
论证:DoorDash 通过提供视频、照片和音频数据,将这些 Dashers 的日常活动转化为有价值的训练材料,证明了这种模式不仅能增加配送员的收入,还能为公司积累海量的真实世界数据。
论点二:利用零工经济劳动力进行 AI 训练已成为行业趋势,DoorDash 的举措并非孤例。
论据:Bloomberg 报道指出,Uber 在去年年底宣布计划让司机通过上传照片等小工作赚取额外收入,以帮助训练 AI 模型。
论证:这表明利用司机或配送员这一现有劳动力池进行数据标注和采集,已经成为科技公司和物流公司利用现有资源提升技术能力的共同选择。
在理解本节引文时,读者可能会对 内部 AI 模型 和 合作伙伴模型 感到困惑。内部 AI 模型 是指 DoorDash 公司自主研发的人工智能系统,用于优化自身的配送路线和业务流程;而 合作伙伴模型 则是指由 DoorDash 的合作伙伴(如零售商、保险公司)开发的 AI 系统,DoorDash 收集的数据也被用于评估和改进这些外部系统的性能。
总结
DoorDash 推出的 "Tasks" 应用标志着零工经济在人工智能训练领域的进一步深化,公司成功地将 800 多万名配送员转化为数据采集员,通过让他们拍摄洗碗视频、拍摄酒店入口或协助关闭 Waymo 自动驾驶汽车车门,为 AI 和机器人系统提供了宝贵的真实世界数据。这一举措不仅为 Dashers 增加了额外的收入来源,也解决了 AI 在物理世界交互理解上的数据匮乏问题。虽然目前该功能仅在美国部分非核心城市开放,且与 Uber 类似,但随着未来任务类型的扩展和覆盖范围的扩大,DoorDash 有望在人工智能的“物理世界数字化”进程中占据重要地位。