DeepSeek急招Agent方向！一口气放17个岗位，重度Vibe Coding优先

标题和作者

本文标题为《DeepSeek急招Agent方向！一口气放17个岗位，重度Vibe Coding优先》，作者为梦晨，发布于量子位。文章主要报道了DeepSeek公司近期大规模开放17个招聘岗位，核心研发岗位聚焦于Agent方向，涵盖了算法研究、数据评测和基础设施等全链条。文章分析了DeepSeek在招聘细节中透露出的战略意图，即从“基础模型研究”向“Agent产品化”倾斜，并探讨了公司如何通过招聘具备特定AI编程工具使用经验的工程师来加速Agent能力的落地与创新。

摘要

DeepSeek近期一口气开放了17个招聘岗位，核心研发岗位全部聚焦于Agent方向，覆盖了算法研究、数据评测和基础设施等全链条。在此之前，DeepSeek的招聘主要集中在“深度学习研究员-AGI”这类通用基础模型研究方向。然而，与之前的通用研究不同，此次招聘明显体现出从“基础模型研究”向“Agent产品化”的战略倾斜。这种转变的原因在于DeepSeek需要构建具备自主规划、工具调用、长期记忆等能力的Agent系统，并希望通过建立“数据-训练-评测”的闭环来避免依赖第三方数据服务。具体做法上，DeepSeek设立了专门的Agent深度学习算法研究员、数据评测专家和基础设施工程师，同时在产品和工程端布局了模型策略产品经理和全栈开发工程师岗位，要求候选人熟悉Tool Use、Planning等核心机制以及MCP等协议。从结果来看，此次招聘拼凑出了DeepSeek在Agent方向的技术布局，表明公司正在搭建从数据生产到模型迭代的完整流水线，并致力于攻克容器调度、资源精细调度等Agent运行时环境的难题。此外，文中提到DeepSeek正在开发对标OpenAI的高级Agent模型，计划在2025年第四季度发布，有望像其R-1推理模型一样颠覆Agent赛道。
本节涉及的专业术语解释如下：Agent（智能体）是指能够感知环境、进行推理并使用工具执行复杂任务的AI系统。RLHF（基于人类反馈的强化学习）和RLAIF（基于AI反馈的强化学习）是提升大模型对齐和能力的常用技术手段。Vibe Coding是指重度使用AI辅助编程工具（如Claude Code、Cursor等）进行开发的一种编码模式。Tool Use（工具调用）是Agent的核心能力之一，指模型能够识别并调用外部工具来完成任务。Data Loop（数据闭环）指的是从数据生产、标注、训练到评测的完整数据迭代流程。

主要主题和概念

重度使用AI编程工具与Vibe Coding的融合
What：在招聘要求中，多个岗位明确要求候选人“重度使用Claude Code、Cursor、Copilot等AI编程工具的优先”，全栈开发工程师岗位更是明确要求“作为Vibe Coding重度用户”。这界定的问题是：开发人员如何利用现有的AI编程能力来加速Agent产品的研发与创新。
Why：这一现象的本质原因在于，DeepSeek希望通过招聘那些已经熟练掌握并能持续探索模型创新应用的工程师，来打破传统开发模式，快速将AI模型能力转化为实际产品功能，尤其是在Vibe Coding这种高效迭代模式下。
How：DeepSeek通过在岗位“加分项”和“岗位职责”中强制提出AI编程工具的使用要求，来筛选出具备高适应性和创新能力的候选人，确保团队能够利用AI工具的高效性来构建下一代Agent应用。
从基础模型研究向Agent产品化的战略转移
What：DeepSeek的招聘重心发生了显著变化，从今年1月集中招聘“深度学习研究员-AGI”等通用研究方向，转变为此次一口气开放17个聚焦Agent方向的岗位，包括算法、数据、基建及产品经理等。
Why：分析其本质原因，是因为DeepSeek已经完成了基础模型的构建，现在急需将模型能力落地为具体的应用场景，如个人助理、自动化工作流等，需要从理论探索转向实际的产品化落地。
How：DeepSeek通过设立专门的Agent深度学习算法研究员、Agent数据评测专家、Agent基础设施工程师等岗位，以及模型策略产品经理和全栈开发工程师岗位，构建了从模型研究、数据生产、评测到基础设施和产品落地的完整团队结构。
构建全链路Agent技术栈与数据闭环
What：DeepSeek的Agent布局不仅限于单一岗位，而是追求“数据闭环能力”和“Agent技术栈的全面布局”。这涉及到构建从数据标注到模型训练再到评测的流水线，以及集成外部工具、搭建评测平台和集成框架。
Why：如果不构建数据闭环，将依赖第三方数据服务，无法精准区分模型能力边界；如果不全面布局技术栈，Agent将无法实现跨session记忆连续性、多工具调度可靠性等核心功能，导致系统无法胜任复杂任务。
How：DeepSeek通过算法研究员与数据标注团队紧密协作设计标注方案，评测专家针对规划、工具调用等设计测试用例，基础设施工程师搭建支持MCP、Function Calling等协议的底层基座，从而实现了Agent系统的整体能力提升。
本节涉及的专业术语解释如下：MCP（Model Context Protocol，模型上下文协议）是Agent交互的一种规范。Function Calling（函数调用）允许模型在推理过程中生成可执行代码或API调用的指令。跨session记忆连续性指的是Agent在不同对话轮次或会话之间保持上下文信息的能力。

重要引文

论点：DeepSeek正在从基础模型研究向Agent产品化方向倾斜，通过大规模招聘构建完整的Agent技术栈和数据闭环。
论据：文章对比了DeepSeek今年1月与现在的招聘差异，指出之前的核心岗位集中在“深度学习研究员-AGI”，而此次一口气开放了17个聚焦Agent方向的岗位，涵盖了算法研究、数据评测、基础设施、产品经理和全栈开发等全链条。同时，文中详细列举了算法研究员的任务（RLHF/RLAIF、过程奖励）、数据评测专家的职责（规划、工具调用、多轮交互）以及基础设施工程师的工作（集成外部工具、搭建评测平台）。
论证：通过分析这些具体的岗位要求，可以看出DeepSeek正在搭建从“数据-训练-评测”的能力提升闭环，并要求熟悉MCP、Tool Use等Agent交互协议。这证明了公司不仅仅是在招聘通用人才，而是在针对性地构建能够支撑复杂Agent系统运行的技术底座和产品能力。此外，文中引用了2025年9月的传闻，称DeepSeek正在开发对标OpenAI的Agent模型，计划在2025年第四季度发布，进一步佐证了其向Agent产品化转型的决心。
本节涉及的专业术语解释如下：RLHF（Reinforcement Learning from Human Feedback，基于人类反馈的强化学习）通过人类评价来调整模型输出。RLAIF（Reinforcement Learning from AI Feedback，基于AI反馈的强化学习）利用AI生成的反馈来替代或补充人类反馈。过程奖励（Process Reward）是指在强化学习中，根据Agent完成任务的具体步骤给予奖励，而不仅仅是根据最终结果。

总结

DeepSeek此次一口气开放17个Agent方向岗位，并明确要求重度使用Claude Code、Cursor等AI编程工具，标志着公司正从通用的基础模型研究阶段，激进地转向复杂的Agent产品化落地阶段。这一战略转变的核心在于构建完整的“数据闭环”和“Agent技术栈”，包括从数据标注、模型训练到评测的流水线，以及支持长期记忆、多工具调度和跨session交互的基础设施。结合2025年9月的行业传闻，DeepSeek计划在2025年第四季度发布对标OpenAI的高级Agent模型，这使其有望像颠覆推理模型行业的R-1模型一样，通过低成本方案再次冲击Agent赛道。对于开发者而言，成为“Vibe Coding重度用户”不仅是加分项，更是未来参与DeepSeekAgent生态建设的关键能力。