清华系团队给大模型织了一张“智能算力电网”
< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400"> # 清华系团队给大模型织了一张“智能算力电网” _[思邈](https://www.qbitai.com/author/simiao "由 思邈 发布")_ 2026-05-29 10:47:09 来源:[量子位](https://www.qbitai.com) 单位Token成本降低40% > 允中 发自 凹非寺 > > 量子位 | 公众号 QbitAI AI芯片,正在机房里猛猛吃灰。 海外高端GPU供不应求、又贵又难买; 国产芯片产能好不容易上来了,结果是「能用但不好用」,生态不全、适配难、推理优化门槛高,大量国产卡就这么空转着,电费照烧,却产不出一颗能用的Token。 企业想用AI,偏偏卡在了最不该卡的环节,**算力** 。 所有人都在比谁的模型参数更大,但真正决定AI能不能落地的,其实是另一件没那么性感的事:**一颗Token,能不能被稳定、便宜、规模化地生产出来。** 死磕这件事的,是一支从中国超级计算体系里走出来的年轻团队,**是石科技** 。 △AI生成 这家公司成立于2021年,由国家超级计算无锡中心的核心科研团队联合组建,是国内最早将超算智算并行优化的技术进行产业化的团队之一。 名字取自“实事求是,甘为基石”,寄托着创始团队对算力基础设施地位的深刻认知。其创始人兼董事长**闫博文** ,出生于1993年,毕业于清华大学,是清华计算机系博士后。 这家公司瞄准的是通过**自主研发的并行优化技术** ,将高性能计算(HPC)与人工智能计算深度融合,专治各种**异构算力资源调度** 的“疑难杂症”。 在他们看来,现在的AI行业根本不需要再多一个算力转租平台,要打破国产算力空转的僵局,必须彻底跳出传统租赁的浅层模式。 是石科技给出的解法直击本质: > 紧扣“Token标准化、国产化、效率提升”这三件事,直接重构算力变现路径,重磅打造国产TOKEN调优工厂。 # 大模型也有了算力“电网”:插上插头,算力秒变Token产能 是石科技TOKEN工厂的第一层技术底座,来自异构算力的全域整合与深度国产化适配。 区别于行业常见的单一算力资源模式,是石科技搭建了全域异构算力资源池,全面兼容NVIDIA GPU、国产AI芯片(包括昇腾、昆仑芯、天数、太初、瀚博半导体等),以及云厂商算力、边缘算力等多源渠道。 通过智能调度与弹性扩缩容技术,实现算力资源的统一纳管、智能分配与动态扩容,让企业不再受困于“算力采购难、资源碎片化”。 △AI生成 打个比方,这就像一张“全域智能电网”。 过去每家工厂只能用自己的发电机(单一算力),买不到柴油就停产,发电机坏了就瘫痪。 是石科技则类似于搭建了一张覆盖全国的算力网络,把各地的风电、水电、火电、太阳能电(各种算力)全部接入统一电网。 企业需要用电时,只需“插上插头”,电网就会自动调度、分配与你需求最匹配的电给你,你完全不用关心电是从哪个具体的电网节点送过来的。 更关键的是,是石科技团队完成了主流国产AI芯片的深度适配与专项优化,打通了**框架适配、算子兼容、通信优化、性能调优全链路** 。 △AI生成 在这张电网的“变电与稳压”作用下,原本闲置、难调通的国产算力,在这里能被高效转化为**稳定、可用、低成本的标准化Token推理产能** 。 通过不断提升算力利用效率,以及充分利用闲时的算力,或者根据客户需求定制专属算力资源,国产Token就可以真正变成可商用的产能优势。 对此,一位长期从事AI基础设施的工程师评价说: > 过去我们买了国产卡,总要花几个月去调驱动、改框架、修bug。是石科技把这条路铺好了。国产卡不再是“摆设”,而是真正能跑生产的引擎。 # 把芯片性能榨干到极限:吞吐暴涨50%,Token成本硬砍40% 如果说算力池化是底座,那么**推理优化** 就是TOKEN工厂的核心技术壁垒。 是石科技团队深耕高性能计算领域多年,在严格恪守企业级SLA服务标准的前提下,从算子、内存、调度、解码等全维度进行技术革新。 CUDA Kernel算子级优化、PagedAttention内存优化、Continuous Batching连续批处理、混合精度推理……这些技术被系统性地部署在TOKEN工厂的生产线上。 配合FlashAttention、推测解码、KV Cache精细化管理、模型并行(TP/PP)等前沿加速方案,GPU等国产芯片的资源利用率大幅提升,Token吞吐总量显著增加,单位Token生产成本大幅下降。 更重要的是,传统推理中常见的延迟抖动、TTFT与TPOT波动等问题得到了有效控制—— Token生成变得高效、稳定、高品质。实测数据显示,在同等算力条件下,是石科技的推理优化方案可将**吞吐量提升30%-50%,单位Token成本降低40%。** △AI生成 # 治好“宕机焦虑”:99.9%高可用,把推理做成不断电流水线 规模化的Token生产,不能建立在脆弱的单点算力之上。 是石科技构建了一套多Provider互补与容灾体系: * 资源互补:流量峰值时自动弹性扩容; * 技术互补:接入特定模型和技术能力(如超低延迟、多模态); * 区域互补:跨地域部署,降低延迟,满足各行业合规要求。 自动Fallback故障切换机制,搭配“自有集群承载主要流量、合作伙伴集群兜底容灾”的流量分配模式,彻底规避单点算力故障导致的业务中断风险。 △AI生成 **99.9%** 的高可用性服务保障,让Token的规模化生产、调度、输出全程稳定可控。 想象一下飞机引擎的“多冗余设计”,即便一台引擎失效,其他引擎能够自动补位,飞机照常飞行。 是石科技相当于给AI推理服务装了三套引擎——包括**自己的引擎、合作伙伴的引擎、备用引擎。** 哪怕其中一套突然熄火,系统会在**0.1秒内自动切换到另一套** ,用户完全感知不到。 从技术上看,这已经不是渐进式的改良,而是从“算力资源”到**“优质Token产能”** 的价值跃迁。 当前,国产AI算力替代进程持续提速。 标准化、可量产、低成本的Token产能,已成为AI产业落地的核心生产资料。 是石科技的目标已经明确: > 建成中国最大、技术最先进、服务最完善的国产TOKEN调优工厂。 让千行百业降低AI落地门槛,让国产算力生态真正实现规模化、高质量发展,推动中国AI产业迈入工业化、标准化的全新阶段。 当行业还在追逐单一模型的精度时,是石科技选择了一条更有挑战但更具长期价值的道路—— **做夯实AI推理底座的工厂,做可进化、可复用、可普惠的Token生产力平台。** 这条路投入更大、周期更长、协调更复杂。 但一旦走通,它改变的将不只是某一家企业的推理成本,而是整个适合中国AI产业高效发展的国产算力生态。 _版权所有,未经授权不得以任何形式转载及使用,违者必究。_ [AI infra](https://www.qbitai.com/tag/ai-infra) [清华](https://www.qbitai.com/tag/%e6%b8%85%e5%8d%8e) [算力电网](https://www.qbitai.com/tag/%e7%ae%97%e5%8a%9b%e7%94%b5%e7%bd%91) [超算](https://www.qbitai.com/tag/%e8%b6%85%e7%ae%97) * [世界模型接棒语言模型,这家公司全球首创物理AGI“双金字塔”体系,通用机器人进入“家庭时代”](https://www.qbitai.com/2026/05/426237.html "世界模型接棒语言模型,这家公司全球首创物理AGI“双金字塔”体系,通用机器人进入“家庭时代”") _2026-05-28_ * [触觉具身来了个梦之队:天使轮近亿](https://www.qbitai.com/2026/05/425660.html "触觉具身来了个梦之队:天使轮近亿") _2026-05-27_ * [图灵奖得主领衔,中国大模型第一梯队集结!2026智源大会,看懂AI下一程](https://www.qbitai.com/2026/05/424551.html "图灵奖得主领衔,中国大模型第一梯队集结!2026智源大会,看懂AI下一程") _2026-05-25_ * [华为具身大脑一号位创业,用认知科学造世界模型,获亿元级融资](https://www.qbitai.com/2026/05/423455.html "华为具身大脑一号位创业,用认知科学造世界模型,获亿元级融资") _2026-05-25_ ### 相关阅读 [ ](https://www.qbitai.com/2020/01/10564.html) #### [姚期智主编高中AI教材:清华姚班豪华阵容编委,9月正式出版](https://www.qbitai.com/2020/01/10564.html) [十三](/?author=21)2020-01-07 __[姚期智](https://www.qbitai.com/tag/%e5%a7%9a%e6%9c%9f%e6%99%ba) [姚班](https://www.qbitai.com/tag/%e5%a7%9a%e7%8f%ad) [清华](https://www.qbitai.com/tag/%e6%b8%85%e5%8d%8e) [ ](https://www.qbitai.com/2021/05/24492.html) #### [这周末,清华迎来了最小的学生和最牛的老师,Science都点赞的那种](https://www.qbitai.com/2021/05/24492.html) 三代人的科学传承 [白交](/?author=24)2021-05-30 __[清华](https://www.qbitai.com/tag/%e6%b8%85%e5%8d%8e) [腾讯](https://www.qbitai.com/tag/%e8%85%be%e8%ae%af) [ ](https://www.qbitai.com/2024/11/214984.html) #### [微软清华改进Transformer:用降噪耳机原理升级注意力,一作在线答疑](https://www.qbitai.com/2024/11/214984.html) 诺奖之后,物理学方法改进AI又一案例 [鱼羊](/?author=16)2024-11-03 __[Differential Transformer](https://www.qbitai.com/tag/differential-transformer) [微软](https://www.qbitai.com/tag/%e5%be%ae%e8%bd%af) [清华](https://www.qbitai.com/tag/%e6%b8%85%e5%8d%8e) [ ](https://www.qbitai.com/2019/08/6783.html) #### [清华魏少军提出AI“智慧新品”11大基本要素](https://www.qbitai.com/2019/08/6783.html) [安妮](/?author=9)2019-08-30 __[清华](https://www.qbitai.com/tag/%e6%b8%85%e5%8d%8e) [ ](https://www.qbitai.com/2021/10/29689.html) #### [中国如何赢得新一轮超算竞赛?关键在向数据密集型超算转变](https://www.qbitai.com/2021/10/29689.html) 国际超算竞争今年到了关键节点 [梦晨](/?author=32)2021-10-25 __[超算](https://www.qbitai.com/tag/%e8%b6%85%e7%ae%97) [超级计算机](https://www.qbitai.com/tag/%e8%b6%85%e7%ba%a7%e8%ae%a1%e7%ae%97%e6%9c%ba) [ ](https://www.qbitai.com/2025/07/315058.html) #### [单张消费级显卡也能参与大模型训练!无问芯穹用「三个盒子」打通十万卡到一张卡AI效能跃升路径](https://www.qbitai.com/2025/07/315058.html) 资源有限,但智能无限 [衡宇](/?author=54)2025-07-29 __[AI infra](https://www.qbitai.com/tag/ai-infra) [WAIC 2025](https://www.qbitai.com/tag/waic-2025) [无问芯穹](https://www.qbitai.com/tag/%e6%97%a0%e9%97%ae%e8%8a%af%e7%a9%b9)