谷歌新论文把内存股价干崩了!KV cache压缩6倍,网友:硅谷成真了 profile-avatar
< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400"> # 谷歌新论文把内存股价干崩了!KV cache压缩6倍,网友:硅谷成真了 profile-avatar _[梦晨](https://www.qbitai.com/author/mengchen "由 梦晨 发布")_ 2026-03-26 11:03:26 来源:[量子位](https://www.qbitai.com) 内存啥时候降价 > 梦晨 发自 凹非寺 > 量子位 | 公众号 QbitAI 学术会议**ICLR** ,居然和**美光和西部数据大跌** 扯上关系了? 两家存储芯片巨头股价大跌,没有财报暴雷,没有供应链断裂,**只是谷歌展示了一篇即将在ICLR 2026正式亮相的论文** 。 谷歌研究院推出**TurboQuant** 压缩算法,把AI推理过程中最吃内存的KV cache**压缩至少6倍,精度零损失** 。 市场的解读简单粗暴,长上下文AI推理以后不需要那么多内存了,利空内存。 网友纷纷表示,这不就是美剧**《硅谷》** 里的Pied Paper? Pied Piper是2014年开播的HBO经典美剧《硅谷》里的虚构创业公司,核心技术就是一种“近乎无损的极限压缩算法”。 2026年,类似的算法在现实世界居然成真了。 # KVCache量化到3 bit 要理解TurboQuant为什么重要,先得理解它解决的是什么问题。 AI大模型推理时处理过的信息会临时存在**KV Cache** ,方便后续快速调用,不用每次从头算起。 问题是随着上下文窗口越来越长,内存消耗急剧膨胀。KV cache正在成为AI推理的核心瓶颈之一。 传统的解决思路是向量量化,把高精度数据压成低精度表示。 但尴尬的是,大部分量化方法本身也需要存储额外的“量化常数”,每个数字要多占1到2个bit。 TurboQuant用两个改动把这个额外开销干到了零。 **PolarQuant(极坐标量化):** 不用传统的X、Y、Z坐标描述数据,转而用极坐标”距离+角度”。 谷歌团队发现,转换后角度的分布非常集中且可预测,根本不需要额外存储归一化常数。 就像把“往东走3个路口,往北走4个路口”压缩成”朝37度方向走5个路口”。 信息量不变,描述更紧凑,还省掉了坐标系本身的开销。 **QJL(量化JL变换):** 把高维数据投影后压缩成+1或-1的符号位,完全不需要额外内存。TurboQuant用它来消除PolarQuant压缩后残留的微小误差。 两者组合后PolarQuant先用大部分bit容量捕捉数据的主要信息,QJL再用1个bit做残差修正。 最终实现3-bit量化,无需任何训练或微调,精度零损失。 # 8倍加速,Benchmark全线拉满 谷歌团队在Gemma和Mistral等开源模型上,跑了主流长上下文基准测试,覆盖问答、代码生成、摘要等多种任务。 在“大海捞针”任务上,TurboQuant在所有测试中拿下完美分数,同时KV cache内存占用缩小了至少6倍。 PolarQuant单独使用,精度也几乎无损。 速度提升同样显著。在英伟达H100 GPU上,4-bit TurboQuant计算注意力分数的速度,比32-bit未量化版本快了8倍。 **不只是省内存,还更快了。** 在向量搜索领域,TurboQuant同样超越了现有最优量化方法的召回率,而且不需要针对具体数据集做调优,也不依赖低效的大码本。 # AI内存的DeepSeek时刻? Cloudflare CEO评价**“这是谷歌的DeepSeek时刻”** 。 他认为DeepSeek证明了用更少的资源也能训出顶尖模型。 TurboQuant的方向类似,用更少的内存,也能跑同样质量的推理。 谷歌表示,TurboQuant除了可以用在Gemini等大模型上,同时还能大幅提升语义搜索的效率,让谷歌级别的万亿级向量索引查询更快、成本更低。 不过TurboQuant目前还只是一个**实验室成果** ,尚未大规模部署。 更关键的是,它只解决**推理阶段** 的内存问题。而AI训练环节完全不受影响。 论文地址: https://research.google/blog/turboquant-redefining-ai-efficiency-with-extreme-compression/ 参考链接: [1]https://x.com/eastdakota/status/2036827179150168182?s=20 _版权所有,未经授权不得以任何形式转载及使用,违者必究。_ [谷歌](https://www.qbitai.com/tag/%e8%b0%b7%e6%ad%8c) * [DeepSeek急招Agent方向!一口气放17个岗位,重度Vibe Coding优先](https://www.qbitai.com/2026/03/392024.html "DeepSeek急招Agent方向!一口气放17个岗位,重度Vibe Coding优先") _2026-03-25_ * [OpenClaw逼出Claude最强反击!GUI操控电脑和真人无差别,网友:这得花多少token?](https://www.qbitai.com/2026/03/391567.html "OpenClaw逼出Claude最强反击!GUI操控电脑和真人无差别,网友:这得花多少token?") _2026-03-24_ * [黄仁勋发Token当工资!硅谷兴起刷量大赛,一人烧掉33个维基百科](https://www.qbitai.com/2026/03/391061.html "黄仁勋发Token当工资!硅谷兴起刷量大赛,一人烧掉33个维基百科") _2026-03-23_ * [黄仁勋:每一家工业企业都将成为机器人公司!连发物理AI全家桶](https://www.qbitai.com/2026/03/389569.html "黄仁勋:每一家工业企业都将成为机器人公司!连发物理AI全家桶") _2026-03-20_ ### 相关阅读 [ ](https://www.qbitai.com/2019/07/4566.html) #### [谷歌新操作系统Fuchsia网站上线,同时支持手机和PC,鼓励开发者参与进来](https://www.qbitai.com/2019/07/4566.html) 不只是取代安卓 [安妮](/?author=9)2019-07-01 __[操作系统](https://www.qbitai.com/tag/%e6%93%8d%e4%bd%9c%e7%b3%bb%e7%bb%9f) [谷歌](https://www.qbitai.com/tag/%e8%b0%b7%e6%ad%8c) [ ](https://www.qbitai.com/2024/09/189808.html) #### [小模型越级挑战14倍参数大模型,谷歌开启Test-Time端新的Scaling Law](https://www.qbitai.com/2024/09/189808.html) 扩展模型测试时计算比扩展参数可能更有效 [西风](/?author=47833)2024-09-11 __[大模型推理](https://www.qbitai.com/tag/%e5%a4%a7%e6%a8%a1%e5%9e%8b%e6%8e%a8%e7%90%86) [谷歌](https://www.qbitai.com/tag/%e8%b0%b7%e6%ad%8c) [ ](https://www.qbitai.com/2022/02/32790.html) #### [修Bug哪家强?谷歌:Linux,比我都修得好](https://www.qbitai.com/2022/02/32790.html) 谷歌最新报告:各家修Bug都越修越快,但我们倒退了 [博雯](/?author=37)2022-02-20 __[bug](https://www.qbitai.com/tag/bug) [iOS](https://www.qbitai.com/tag/ios) [linux](https://www.qbitai.com/tag/linux) [安卓](https://www.qbitai.com/tag/%e5%ae%89%e5%8d%93) [谷歌](https://www.qbitai.com/tag/%e8%b0%b7%e6%ad%8c) [ ](https://www.qbitai.com/2023/03/42501.html) #### [ChatGPT吸走谷歌人才,谷歌云CEO:AI新游戏刚开场,莫慌](https://www.qbitai.com/2023/03/42501.html) 谷歌员工开始对着Bard骂谷歌了... [鱼羊](/?author=16)2023-03-03 __[ChatGPT](https://www.qbitai.com/tag/chatgpt) [谷歌](https://www.qbitai.com/tag/%e8%b0%b7%e6%ad%8c) [ ](https://www.qbitai.com/2023/05/51450.html) #### [谷歌内部文件泄露:大模型已被开源社区「偷家」,不改变ChatGPT也会黯然失色](https://www.qbitai.com/2023/05/51450.html) “我们和OpenAI都没有护城河” [鱼羊](/?author=16)2023-05-06 __[OpenAI](https://www.qbitai.com/tag/openai) [大模型](https://www.qbitai.com/tag/%e5%a4%a7%e6%a8%a1%e5%9e%8b) [谷歌](https://www.qbitai.com/tag/%e8%b0%b7%e6%ad%8c) [ ](https://www.qbitai.com/2022/07/36321.html) #### [马斯克被曝绿了谷歌创始人,为求原谅还下跪请罪!导致布林二婚破裂](https://www.qbitai.com/2022/07/36321.html) 布林:接受道歉,但不原谅 [邓思邈](/?author=50)2022-07-25 __[人口管理大师马斯克](https://www.qbitai.com/tag/%e4%ba%ba%e5%8f%a3%e7%ae%a1%e7%90%86%e5%a4%a7%e5%b8%88%e9%a9%ac%e6%96%af%e5%85%8b) [谷歌](https://www.qbitai.com/tag/%e8%b0%b7%e6%ad%8c) [马斯克](https://www.qbitai.com/tag/%e9%a9%ac%e6%96%af%e5%85%8b) [马斯克又发车了](https://www.qbitai.com/tag/%e9%a9%ac%e6%96%af%e5%85%8b%e5%8f%88%e5%8f%91%e8%bd%a6%e4%ba%86)