0
本文作者:士咷 | 2025-07-04 09:30:21 |
晶上生成式变结构核算可为我国打破算力芯片“制程工艺茧房”拓荒新途径,国智走出一条用“三流资料 、算完k式二流工艺”达到“一流才干”的包围系统工程级立异道路 。
图为长三角(芜湖)智算中心 。国智 视觉我国供图 。算完k式
今年以来 ,包围我国以DeepSeek为代表的国智大模型企业经过算法优化、有针对性的算完k式练习和开源生态协作 ,在运用“缩水版”GPU芯片的包围情况下 ,将千亿参数模型练习本钱紧缩至同类模型的国智1/10,走出了一条从粗豪式算力堆砌向内生式效能提高的算完k式新途径。
在全球惊叹我国非对称立异奇观的包围一起 ,也要清醒看到,国智就人工智能(AI)技能和工业自主可继续发展而言 ,算完k式我国仍未脱节对高端甚至“缩水版”智算芯片等物理器材的包围依靠 。在可以预见的未来 ,外部环境或许更趋恶劣 ,封闭遏止常态化、供应链不确定性等应战难以逃避。我国亟需在智能算力层面完成“DeepSeek式包围”,用超限立异解耦当时硬件算力提高与制程工艺前进强绑定的联系。
换言之,我国要在AI范畴取得与竞争对手可博弈的才干,不只要在算法层面继续革新 、打破“算力茧房”,并且要在算法与物理层面深度交融上完成换道超车 ,破解“制程工艺茧房”。以生成式变结构核算 、软件界说晶上系统(Software defined System on Wafer ,SDSoW)为主要内容的晶上生成式系统架构,为处理算法模型与算力载体失配难题 、增强软硬件协同算力可继续发展供给了新的技能途径。
让核算架构的“鞋”习惯算法的“脚”。
先进的芯片制程工艺可以供给更高的晶体管密度,提高芯片单位面积核算才干,为大模型练习和推理供给更强壮的核算资源支撑 。但是,依据复原论的工程规划范式 ,芯片制程工艺艰苦迭代取得的物理算力提高,很难被大规划分布式物理系统上运转的软件算法有用运用。芯片峰值核算才干与算法系统性收益存在结构性错位 ,加之分布式系统在技能系统上受“大规划 、低时延、高带宽”不或许三角问题限制 ,靠简略堆砌千张 、万张甚至十万张以上GPU卡的办法,难以满意“规划规律-Scaling low”驱动的大模型练习之非线性算力增加需求 。
简而言之,因为存算别离系统的冯·诺依曼核算架构,硬件系统规划(如芯片制程、内存带宽 、并发单元等)与算法模型的运算特征(如核算密度、数据流形式、精度需求等)之间存在系统性错位 。即使芯片制程工艺有所前进,带来了功用增益,也会因为“逐级插损”的系统工程范式大打折扣。
打破“制程工艺茧房” ,在更高维度上寻求问题的解空间 ,需求革新传统刚性核算架构及技能物理完成范式。
近80年来,传统核算架构一向沿袭运算器、控制器 、内存储器 、输入输出设备几大件组成的冯·诺依曼核算架构。无论是杂乱的AI算法 ,仍是简略的数据处理使命 ,都被“硬塞”进刚性的核算架构之中,奢求“一了百了”地处理千变万化的运用 。这就比如不论你脚多大,都必须穿37码的鞋才干走路。但是 ,鞋不合脚就走不快:小脚穿大鞋会绊脚;大脚穿小鞋则会感到疼