于骞出席德国慕尼黑汽车论坛：世界模型+强化学习是通向物理AI的必经之路

标题和作者

标题：于骞出席德国慕尼黑汽车论坛：世界模型+强化学习是通向物理AI的必经之路
作者：量子位的朋友们
概括：本文介绍了轻舟智航联合创始人于骞在德国慕尼黑论坛上的演讲内容。于骞阐述了从“类人智能”向“超人智能”即“物理AI”的演进，指出自动驾驶与围棋AI的本质区别，并提出了以“世界模型+强化学习”为核心的技术路径，同时介绍了公司百万台量产验证及全球化布局的战略。

摘要

本文主要探讨了通用物理AI（超人智能）时代的到来及其在自动驾驶领域的应用。此前，AI虽然在围棋等虚拟博弈中战胜人类，但在自动驾驶领域进展缓慢，原因在于自动驾驶面临的是无限不确定性的物理世界和安全红线限制。为了解决这一难题，本文介绍了轻舟智航提出的“世界模型+强化学习”技术架构，通过构建虚拟“驾校”来模拟现实场景并优化决策，从而让AI具备推理泛化和物理规律理解能力。在结果上，轻舟智航已实现百万台量产验证，证明了技术创新优于单纯算力堆砌，并构建了L2++与L4双轮驱动的商业落地模式。
为帮助读者理解，需要解释几个核心概念。首先是“世界模型”，它是一个能够模拟现实世界物理规律和场景变化的系统，类似于AI的“大脑模拟器”。其次是“强化学习”，它是一种通过试错来优化决策的机器学习方法，就像一位不知疲倦的教练。此外，文中提到的“NOA”是指“Navigate on Autopilot”（辅助导航驾驶），即车辆的自动导航辅助功能；“L2++”代表比L2级更高阶的辅助驾驶能力；“L4”代表高度自动驾驶；“ASPICE CL2”是汽车软件过程改进及能力评定标准的第二级；“ISO26262”是道路车辆功能安全标准；“ISO21434”是道路车辆网络安全标准；“TOPS”是算力单位，代表每秒万亿次浮点运算次数。

主要主题和概念

主题概念一：物理AI与超人智能的跃迁
What：这一概念界定了AI发展的新阶段，即从单纯模仿人类行为的“类人智能”转向能够理解物理规律、社会常识和人类意图的“超人智能”。
Why：其本质原因在于自动驾驶与围棋等虚拟游戏具有根本不同。围棋是完美信息的虚拟博弈，可以在云端无限试错；而自动驾驶面对的是无限不确定性的物理世界，且受限于安全红线，无法在真实环境中像围棋AI那样“野蛮生长”，必须掌握推理泛化、物理规律理解和社会常识决策三大核心能力。
How：轻舟智航通过引入“世界模型+强化学习”来解决这一难题，让系统从“被动记忆”转向“主动思考”，真正具备应对未知的能力。
此外，文中提到的“世界模型”是指一种能够预演现实场景无限可能性的模型，它负责模拟复杂路口博弈、极端天气等长尾场景；“强化学习”则是一种通过持续试错来优化决策路径的方法，两者结合构成了通向物理AI的必经之路。

主题概念二：百万台量产验证与技术创新
What：指轻舟智航在2026年1月实现的辅助驾驶系统搭载量突破100万台，以及在低算力平台上实现高阶功能的技术成果。
Why：这一验证证明了“普惠智驾”的可行性，打破了算力堆砌才能实现高阶智能的固有认知，展示了在有限硬件条件下通过算法优化达到高智能水平的可能性。
How：轻舟智航在仅128TOPS的算力平台上实现了业界领先的城市NOA功能，通过技术创新优化了算法效率。在商业化上，公司构建了L2++（辅助驾驶增强级）与L4（高度自动驾驶）双轮驱动的模式，其中L4无人物流车已落地，Robotaxi计划于2027年部署。
此处涉及的“NOA”即“Navigate on Autopilot”（辅助导航驾驶），是自动驾驶领域的重要功能；“L2++”代表比L2级更高阶的辅助驾驶能力；“L4”代表高度自动驾驶，通常指车辆在特定设计运行条件下完全无人驾驶；“Robotaxi”指无人驾驶出租车；“128TOPS”是算力单位，代表每秒万亿次浮点运算次数，是衡量AI芯片算力的重要指标。

主题概念三：全球化布局与本地化服务
What：轻舟智航在慕尼黑设立办公室，将在中国验证的AI技术与德国汽车工业底蕴融合，并兼容全球主流芯片平台。
Why：慕尼黑是全球汽车工业与工程创新的心脏，通过融合双方优势，可以更好地适应全球主机厂的硬件需求，并在严格的安全体系下实现技术落地。
How：轻舟智航实现了对英伟达、高通、地平线三大全球主流芯片平台的兼容，并全面符合ASPICE CL2（汽车软件过程改进及能力评定标准，第二级）、ISO26262（道路车辆功能安全标准）和ISO21434（道路车辆网络安全标准）等国际最高技术与安全标准，推行“量产即运营”的范式。
此处涉及的“ASPICE CL2”是汽车软件过程改进及能力评定标准的第二级，用于评估汽车行业软件供应商的过程能力；“ISO26262”是道路车辆功能安全标准，确保系统在故障发生时不会对人员和财产造成危险；“ISO21434”是道路车辆网络安全标准，关注车辆的信息安全风险；“量产即运营”是指车辆一旦量产下线，即刻开始提供运营服务。

重要引文

论点一：AI在围棋中战胜人类，但在自动驾驶领域却难以媲美人类，需要全新的技术路径。
论据：围棋是虚拟世界的完美信息博弈，AI可以在云端进行无限次低成本试错；而自动驾驶面对的是无限不确定性的物理世界，安全红线决定了它无法在真实环境中进行“野蛮生长”，无法像围棋AI那样积累海量经验。
论证：这一对比揭示了自动驾驶必须解决的终极难题——如何在保障安全的前提下，掌握推理泛化、物理规律理解以及社会常识决策三大核心能力，从而证明了“世界模型+强化学习”是通向物理AI的必经之路。
此外，文中提到的“野蛮生长”意指在缺乏约束和风险控制的情况下快速尝试和进化，这在涉及人类生命安全的自动驾驶领域是不可行的；“世界模型”在此处是指能够模拟现实世界各种复杂场景的模型，是构建物理AI的关键组件；“强化学习”则是一种通过反复试错来学习最优策略的机器学习方法。

论点二：轻舟智航提出的“世界模型+强化学习”架构是AI从“被动记忆”转向“主动思考”的关键。
论据：轻舟将这一技术架构比喻为一座AI虚拟“驾校”，其中世界模型负责预演现实场景的无限可能性，模拟复杂路口博弈、极端天气等长尾场景，强化学习则像一个不知疲倦的教练，持续优化AI的决策路径。
论证：这种架构的独特价值在于，它让自动驾驶系统从单纯依赖历史数据的“被动记忆”转向能够应对未知场景的“主动思考”，真正具备了应对长尾问题和复杂环境的能力。
此处涉及的“长尾场景”是指那些发生概率低但影响大、难以预测的极端情况，如夜间避让密集电动车；“强化学习”是一种通过智能体与环境的交互来学习最优策略的机器学习方法，类似于人类通过练习掌握技能；“世界模型”在此语境下是指能够生成逼真场景数据来训练AI的模型。

论点三：轻舟智航通过技术创新在低算力平台上实现了高阶功能，并已获得百万台量产验证。
论据：轻舟智航在仅128TOPS的算力平台上实现了业界领先的城市NOA功能，且在2026年1月迎来了辅助驾驶系统搭载量突破100万台的历史性节点。
论证：这一成果有力证明了技术创新优于单纯算力堆砌，并验证了“普惠智驾”的商业路径，同时也展示了轻舟智航在商业化落地上构建的L2++（辅助驾驶增强级）与L4（高度自动驾驶）双轮驱动模式的成功。
此处涉及的“128TOPS”是算力单位，代表每秒万亿次浮点运算次数，是衡量AI芯片性能的关键指标；“NOA”即“Navigate on Autopilot”（辅助导航驾驶），是现代智能汽车的重要功能；“L2++”代表比L2级更高阶的辅助驾驶能力；“L4”代表高度自动驾驶。

总结

本文的核心亮点在于揭示了自动驾驶技术从“类人智能”向“超人智能”转型的必然趋势，并详细阐述了“世界模型+强化学习”作为突破物理世界不确定性限制的核心解法。轻舟智航通过构建虚拟“驾校”模拟现实场景，成功实现了在百万台量产车辆上的高阶功能部署，证明了算法优化比单纯堆砌算力更具商业价值。目前，轻舟已形成L2++与L4双轮驱动的商业化闭环，并在慕尼黑设立办公室，计划将中国验证的AI技术推向全球。展望未来，随着Robotaxi业务在2027年的规模化部署，轻舟的物理AI底座有望从汽车延伸至机器人等更多领域，进一步深化其“量产即运营”的全球化战略。