Microsoft’s first advanced reasoning AI is here

标题和作者

本文标题为“微软的首个先进推理AI已来”，作者Jay Peters是The Verge的高级科技记者。文章主要报道了微软在Build 2026大会上发布的七个新模型，特别是其首个自研的先进推理AI——MAI-Thinking-1，标志着微软在AI领域摆脱对OpenAI依赖、转向自主研发的重要转折点。

摘要

本文详细介绍了微软在Build 2026上发布的MAI-Thinking-1及其配套的六个新模型。在此之前，微软主要依赖OpenAI的模型，近期双方刚重新谈判以松绑合作关系，因此微软急需推出自研模型来保持竞争力。MAI-Thinking-1是一个“中型模型”，微软强调它是“从零开始”训练的，使用干净的数据，没有从第三方模型中提取知识。它在关键的软件工程基准测试中表现优异，可与领先模型相媲美。此外，文章还介绍了专注于图像生成、转录、语音和代码的模型，如MAI-Image 2.5、MAI-Transcribe-1.5（速度是竞争对手的5倍）、MAI-Voice-2（新增15种语言）以及MAI-Code-1-Flash（推理高效，已集成到Visual Studio Code中）。

术语解释：文中提到的“distillation”通常指蒸馏，即从已有模型中提取知识来训练新模型。微软强调MAI-Thinking-1没有使用这种方法。“Benchmark”指基准测试，是衡量模型性能的标准测试集。

主要主题和概念

MAI-Thinking-1

What：这是微软在Build 2026上发布的首个先进推理AI，被定位为一个“中型模型”。
Why：在微软与OpenAI关系松绑的背景下，微软需要证明自己有能力开发出高性能的自研模型，特别是在软件工程领域。
How：该模型完全从零开始，使用干净的数据进行训练，并没有依赖从第三方模型中提取知识的“蒸馏”技术。

模型生态扩展

What：微软推出了涵盖图像、转录、语音和代码等领域的七个新模型，包括MAI-Image 2.5、MAI-Transcribe-1.5、MAI-Voice-2和MAI-Code-1-Flash。
Why：为了提供更全面的工具集，提升开发者的效率，并丰富不同场景下的AI应用体验。
How：图像模型支持文本生成和编辑；转录模型速度是竞争对手的五倍；语音模型增加了15种新语言；代码模型具备高推理效率并已集成到GitHub Copilot和Visual Studio Code中。

合作关系的调整

What：微软最近重新谈判了与OpenAI的协议，旨在减少对后者的依赖。
Why：这种调整赋予了微软更多的自主权，使其能够独立开发全新的MAI系列模型，从而掌握技术主动权。
How：这一调整直接促成了MAI-Thinking-1等新模型的诞生，标志着微软从单纯使用OpenAI模型转向了自研模型的道路。

术语解释：文中提到的“inference-efficient”通常指推理高效，即模型在生成结果时所需的计算资源较少，运行速度快且成本低。

重要引文

论点：微软已成功开发出首个先进的推理AI模型，标志着其摆脱对OpenAI依赖并实现自研技术突破。

论据：微软表示，MAI-Thinking-1是一个“中型模型”，在关键的软件工程基准测试中表现优异，能够与领先模型相媲美。此外，该公司强调该模型是“从零开始”训练的，使用的是干净的数据，并且“没有从第三方模型中提取知识”。

论证：通过展示MAI-Thinking-1在基准测试中的表现以及其独特的训练方式（不依赖蒸馏），微软证明了其拥有独立开发高性能AI模型的能力，这直接回应了之前仅依赖OpenAI的现状。

术语解释：“Ground up”意为从零开始或从基础做起，指不依赖现有的预训练模型作为基础，而是从原始数据直接训练。“Distillation”指蒸馏，是一种机器学习技术，通过将大型复杂模型的知识转移给小型模型来创建更高效的模型。

总结

本文最重要的亮点是微软推出了首个先进推理AI模型MAI-Thinking-1，这是微软在重新谈判OpenAI协议、试图减少对第三方依赖后的首个重磅自研成果。该模型在软件工程基准测试中表现出色，完全从干净数据中训练，不依赖蒸馏技术。除了推理模型，微软还推出了涵盖图像、转录、语音和代码的全方位AI模型套件。其中，代码模型MAI-Code-1-Flash已集成到Visual Studio Code中，转录模型速度是竞争对手的五倍。随着微软构建这一套完整的自研模型生态，开发者将获得更高效的工具，而微软也在AI领域确立了更加独立的地位。