标题和作者

本文标题为《对话越疆刘培超:春晚隐藏具身选手,却是百亿市值大玩家》,作者为田, 晏林。文章主要聚焦于越疆科技创始人刘培超的创业历程及其公司从传统协作机器人向具身智能领域的战略转型。越疆科技作为“中国协作机器人第一股”,市值已达161亿元人民币。文章深入探讨了刘培超如何带领团队在2024年抓住斯坦福Aloha论文带来的技术窗口,启动内部代号“630”的具身智能项目,并披露了其自研ATOM-VLA模型、与腾讯云合作以及应对资本市场挑战等细节,展现了一位百亿市值公司董事长从初创艰辛到技术革新的立体形象。

摘要

本文详细阐述了越疆科技创始人刘培超如何带领公司从传统的协作机器人业务转型至具身智能领域,并披露了内部代号“630”项目的具体细节与战略布局。此前,机器人行业主要依赖传统编程或手势控制,难以实现复杂任务。斯坦福Aloha团队发表的论文展示了大模型驱动机器人完成烹饪等复杂动作的能力,这正是刘培超十年来的追求,促使他决定进行技术路线的转型。具体做法是,2024年4月启动技术验证,6月30日组建200人团队,自研ATOM-VLA大模型,推出X-trainer双臂机器人,并与腾讯云合作打造一体化解决方案。目前越疆具身智能团队规模已超200人,收入达千万级,首款人形机器人Dobot Atom已正式发布。

此外,本文还解释了具身智能领域的一些核心概念。具身智能是指让机器人不仅拥有硬件身体,还能通过大脑模型理解环境并自主执行任务,从单纯的“感知智能”走向“行动智能”。ATOM-VLA(Vision-Language-Action)是一种端到端的大模型,它具备场景理解、任务分解和路径规划的能力,能够将自然语言指令直接转化为精准的动作执行,是越疆实现“大脑小脑协同”的关键底座。

主要主题和概念

主题一:从传统控制向大模型驱动的技术路线转型

  • What(界定问题):过去十年,协作机器人主要依赖传统编程或手势控制,用户需要预先定义每一个动作,无法灵活应对非结构化环境中的复杂任务,限制了机器人的应用范围。
  • Why(分析问题):2024年初,斯坦福Aloha团队发表的论文证明了无需预编程,仅靠大模型驱动即可让机器人完成浇花、炒菜等复杂任务,这验证了刘培超十年来的构想,即用“大脑”控制机器人进入千家万户,解决了过去“手教人”的低效痛点。
  • How(解决问题):2024年4月启动技术验证,快速推出国内第一代商用机型X-trainer;6月30日正式启动“630项目”,组建200人团队;自研ATOM-VLA大模型作为核心大脑,结合双臂硬件,实现了从自然语言指令到动作执行的端到端闭环。

主题二:To B优先的商业场景落地策略

  • What(界定问题):在具身智能发展的初期,如何选择合适的切入点来实现商业价值和技术验证,避免盲目追求通用性而陷入困境。
  • Why(分析问题):工业和商业场景的需求明确、任务可验证,能够帮助用户快速计算ROI(投资回报率),且这些场景对硬件能力的容错率相对较低,需要高精度的运动控制,这正是越疆长期积累的优势领域。
  • How(解决问题):坚持在工业制造(如汽车、3C)和商业服务(如咖啡、奶茶)领域深耕,利用积累的真实非结构化数据训练模型,构建“一脑多体”平台以适应不同场景,而非直接进入技术要求更高但容错率更低的To C家庭市场。

此外,本文需要解释“一脑多体”这一核心概念。这是越疆具身智能落地的核心架构,意指构建一个统一的智能大脑,能够驱动多种不同形态的机器人本体(如单臂、双臂、轮式、人形等)。这种架构解决了未来场景多元化的问题,通过一个大脑适配多个身体,从而降低了研发成本并提高了部署效率。

重要引文

论点一:大模型是机器人从“感知”走向“行动”的关键

  • 论据:斯坦福Aloha团队在2024年年初发表了一篇论文,展示的机器人不仅能做机械手浇花,还能晾衣服、炒菜,证明了机器人可以不靠传统算法,而是用大模型驱动。
  • 论证:刘培超在阅读相关论文后意识到,这正是他们追求了十年的方向,即用大脑控制的方式替代传统的编程控制,因此他立即决定启动转型,推出了基于大模型的双臂机器人X-trainer。

论点二:上市公司做具身智能需平衡资本与研发

  • 论据:越疆科技在2024年12月登陆港交所,上市后品牌知名度提高,但也需要向资本市场公开透明地交代战略,还要按时间节点交付结果,这给企业带来了新的约束。
  • 论证:尽管面临股东对港股流动性的担忧和上市后的精力分散,刘培超通过快速推进上市(从决策到上市仅用几个月)筹集了25亿资金,并将资金大头用于AI和具身智能研发,同时利用上市平台聚集资源,以支持其长期的战略投入。

论点三:竞争是推动行业做大做强的动力

  • 论据:刘培超表示,现在的竞争太激烈,就像开盲盒,只有极度认真、持续深耕前沿才有可能不掉队,并坦言“不怕竞争,欢迎大家放马过来”。
  • 论证:他认为这个赛道和场景是无限大的,比手机市场大百倍,充分的竞争环境能督促企业每天做正确的事,只有把蛋糕做大,让更多领域用上机器人,行业才能健康发展。

此外,本文需要解释“ATOM-VLA”这一专有名词。ATOM-VLA是越疆自研的具身智能大脑模型,全称为Vision-Language-Action模型。它类似于人类的小脑与大脑的协同,能够理解视觉信息、自然语言指令,并规划出具体的动作路径,最终控制机器人完成从拿取物体到放置物体的全过程,是越疆技术壁垒的重要组成部分。

总结

越疆科技作为春晚舞台上的“隐藏选手”,实际上已悄然完成了从传统协作机器人龙头向具身智能赛道的战略跨越。其创始人刘培超不仅是一位拥有百亿市值的董事长,更是一位曾因资金链断裂而彻夜难眠的创业者,这种韧性在2020年疫情融资冻结、账上仅剩一个月工资的至暗时刻体现得淋漓尽致。面对斯坦福Aloha论文带来的技术机遇,越疆迅速通过“630项目”切入,自研ATOM-VLA模型,推出了Dobot Atom人形机器人,并依托工业场景积累的数据和To B优先的策略,构建了“一脑多体”的技术护城河。虽然当前行业竞争激烈,但越疆凭借其从制造业现场走出来的落地能力和持续的研发投入,已展现出在千亿级市值潜力市场中的独特优势。