从英伟达去年重磅发布NVL 72超节点解决方案✿◈,到华为今年高调推出CloudMatrix 384✿◈,“超节点”火了新报跑狗✿◈。用网络能力将众多芯片高效连接✿◈、协同工作✿◈,以集群性能取代单一芯片性能比拼✿◈,成为行业共识✿◈。
在“超节点”的新赛场上✿◈,具备入局能力的选手还寥寥无几BALLBET官网✿◈,曦智科技(下简称“曦智”)已经率先跑出领先身位✿◈。
在刚过去的2025世界人工智能大会(WAIC)上✿◈,曦智发布了具有行业革新意义的“光互连光交换”方案——“光跃LightSphere X”分布式全光互连芯片及超节点解决方案✿◈。
该方案聚焦纵向扩展(Scale-Up)网络✿◈,创新引入光互连技术✿◈,打破了传统方案中物理机柜限制✿◈,实现更大规模✿◈、跨机柜的Scale-Up网络✿◈。基于该方案的几千卡算力集群正在上海落地✿◈,而光跃LightSphere X”的“X”✿◈,实际上意味着超节点的规模可以没有上限✿◈。
曦智有近250人的团队✿◈,研发人员占比超80%✿◈,核心成员有来自MIT的顶尖科学家✿◈,也有拥有丰富行业经验的业界知名人士✿◈。
曦智科技创始人兼CEO沈亦晨在接受21世纪经济报道记者的专访时透露✿◈,在2023年ChatGPT刚兴起不久✿◈、“超节点”概念尚未形成时✿◈,曦智就意识到这是重要机会✿◈,于是把自己的光互连产品线切入了超节点领域✿◈。
他坦率地表示✿◈,当前超节点对曦智而言是一个非常好的机会✿◈,要利用好超节点这波机会✿◈,尽快地推广公司产品✿◈。
曦智选择走英伟达✿◈、华为等公司没走过的创新技术路线✿◈,同时选择走一条开放生态的道路✿◈。“在此生态中BALLBET官网✿◈,我们的战略定位清晰✿◈:聚焦于光互连及光芯片相关的核心技术产品创新✿◈。目前✿◈,我们已在该领域占据有利生态位✿◈。”沈亦晨说✿◈。
在对话中✿◈,沈亦晨介绍了曦智在超节点领域的技术和产品路线✿◈,深入分享了他对于智算行业趋势及市场机会的看法✿◈,以及曦智的商业战略及规划✿◈。
我们最开始是做光计算的✿◈,2021年✿◈、2022年我们的光计算芯片已经出来了✿◈,在规划未来产品的时候✿◈,我们发现互连会是一个很大的瓶颈✿◈。因为当计算芯片的算力越做越大✿◈,如果数据进不去✿◈,就会像一个很厉害的引擎拖了一个破车轮✿◈,是跑不起来的✿◈。所以✿◈,我们内部启动了互连的项目✿◈。
到了2022年底✿◈、2023年的时候ChatGPT爆发✿◈,催生了更大算力的需求✿◈。那个时候我们就想到了超节点BALLBET官网✿◈。
因为一方面✿◈,在我们光计算芯片本身的产品规划里✿◈,就需要将远远超过8颗✿◈,可能几十✿◈、上百颗的计算芯片通过我们的互连技术连接在一起✿◈。
另一方面✿◈,那时一颗英伟达最好的GPU的算力可能等于10颗甚至20颗国产GPU的算力✿◈。所以当时我们判断✿◈,对于国产GPU而言✿◈,一个节点要连接的远远不止8卡✿◈。
2023年的时候其实还没有“超节点”的概念新报跑狗✿◈,当时所有的机柜就是8卡是一个服务器✿◈,一个服务器是一个节点✿◈。2024年BALLBET官网✿◈,慢慢的学界开始讲超过8卡的就是超节点了✿◈,才有了这个概念✿◈。
所以我们其实2023年就开始做超节点了✿◈,不过正式把它命名为“光互连超节点”是在2024年我们第一个千卡集群落地的时候✿◈。
《21世纪经济报道》✿◈:曦智最新公布了一个与沐曦合作的光互连电交换超节点方案✿◈。在技术上与NVL 72和CloudMatrix 384有什么不同?
沈亦晨✿◈:我们这次在WAIC发布了两个超节点方案✿◈:一个是光互连电交换✿◈,另一个是光互连光交换✿◈。前者是比较成熟的方案✿◈,后者是一个创新的方案✿◈。
我们与沐曦合作的光互连电交换超节点方案与英伟达✿◈、华为一样都是用电交换✿◈,不同点在于第一✿◈,在互连协议层面✿◈,我们用的是开放的PCIe协议✿◈,基本上可以用于上海所有GPU公司✿◈。
而英伟达和华为分别是用自己的私有协议NVlink和UB去通话的✿◈,也就是说他们的GPU之间在说一个它们自己的语言✿◈,别的公司的GPU是没法跟它沟通的✿◈。
第二✿◈,英伟达的方案是用全电互连了72张GB200✿◈,华为的方案是把384张卡分布在十几个机柜✿◈,机柜间用华为的光互连技术连接起来✿◈。
我们和华为一样也是用光互连的方式✿◈,但我们光互连的模组是专门定制的✿◈,并且我们去掉了里面的DSP芯片(数字信号处理芯片)✿◈,因此传输速度会具有优势✿◈。
在与沐曦合作落地方案里✿◈,我们突破了跨机柜连接的限制✿◈,能够支持8台标准服务器共64张xPU卡的高速互连BALLBET官网✿◈,为大模型训练及推理提供更灵活✿◈、更高效的并行策略支持✿◈。
沈亦晨✿◈:华为这一代UB单通道的带宽确实比PCIe高一些✿◈,这个方案里PCIe的单通道带宽是32G✿◈,但它的通道数量更多✿◈,所以总带宽是一个可比的情况✿◈。
《21世纪经济报道》✿◈:“光跃LightSphere X”分布式光互连光交换GPU超节点解决方案首创性地采用了光互连光交换✿◈,光交换相比电交换有什么优势?
沈亦晨✿◈:光互连光交换是一个创新的方案✿◈。我们把电交换机去掉了✿◈,用光来做交换和互连✿◈,这是全球首创的✿◈。
我们用光交换有几个原因✿◈。我经常会把电互连和光互连比作公路交通和轨道交通✿◈,电是公路交通✿◈,光是轨道交通✿◈,光在长距离搬运数据时效率更高✿◈,但在短距离上可能是公路交通效率更高✿◈。
光互连电交换就好比你坐火车(光纤)到了一个中转站✿◈,要下火车换乘下一班火车再走✿◈,中间是有比较大的延迟的✿◈,而且它的成本和功耗会比较高✿◈。光互连光交换就好比你不用再下火车(光纤)了✿◈,可以用最短的延迟到达目的地✿◈。这是光交换的一大优点✿◈。
第二个优点是光交换的成本比电交换低✿◈,因为电交换两边要连两个光模块(火车站)✿◈,而光交换可以省掉一半的光芯片✿◈。
第三个优点是一旦用轨道后✿◈,就不需要一个红绿灯语言✿◈,也就是不需要协议了✿◈,所以光交换对协议是无感的✿◈。
这三块其实都很符合国内市场的趋势✿◈。因为国内有很多GPU厂商✿◈,每家都有自己的协议✿◈,其实要定制一个电交换芯片是很困难的✿◈。
另外✿◈,国内要做超节点就不得不用光互连✿◈,这个是必然的趋势新报跑狗✿◈。但光互连的成本比电互连贵一些✿◈,所以怎么能够显著降低光互连和光模块的成本就成了关键✿◈,光交换也能在一定程度上帮助解决成本问题✿◈。
沈亦晨✿◈:在分布式光交换方案下✿◈,超节点的规模没有上限✿◈,这意味着万卡集群也全部可以做成一个超节点✿◈。所以分布式光交换方案我们叫“光跃LightSphere X”✿◈,因为不需要一个指定的数字✿◈,它是无限的✿◈。
当然超节点的规模不是越大越好✿◈,有点像是杀鸡不需要用牛刀✿◈。越大的超节点会在训练越大的模型时发挥更大的作用✿◈,但在特别小的模型上反而是浪费资源✿◈。
所以得益于分布式设计✿◈,光跃LightSphere X可灵活配置超节点的规模✿◈,并可突破传统交换芯片对连接数量限制✿◈,因而是比较适合现在的市场算力需求的✿◈。
《21世纪经济报道》✿◈:把万卡集群全部做成一个超节点✿◈,意味着即便互连跨越机柜✿◈,曦智做的仍是Scale-Up(纵向扩展)网络?在纵向扩展与横向扩展上✿◈,曦智怎么看目前超节点的发展趋势?
沈亦晨✿◈:光跃LightSphere X的核心目标仍是扩展Scale-Up网络✿◈。我们认为超节点将日益增大✿◈,Scale-Up网络也需随之扩展✿◈,但传统Scale-Up网络往往受限于物理机柜的边界✿◈。
我们的创新在于引入光互连技术✿◈,突破了机柜的物理限制✿◈。这使得Scale-Up成为一个逻辑概念——你可以将多个机柜内的GPU整合为一个逻辑上统一的大型超节点✿◈。因此✿◈,我们以创新的光互连方案✿◈,实现了规模更大✿◈、跨越物理机柜的Scale-Up 网络✿◈。
《21世纪经济报道》✿◈:曦智正在与上海仪电落地的超节点算力集群规模有多大?有没有落地更大规模超节点的计划?
《21世纪经济报道》✿◈:曦智与阶跃星辰在基于分布式光交换的万亿参数大模型训练基础设施建设上有合作✿◈。有没有测算或估算过对训练如Step-2✿◈、DeepSeek-V3等大模型在效能和成本上有多大的优化?
沈亦晨✿◈:我们和上海仪电几千卡的算力集群还在落地过程中✿◈,还没有实测过✿◈。但理论数据是有的新报跑狗✿◈,我们在SIGCOMM上发表了一篇论文✿◈,显示收益是非常显著的✿◈。基于分布式光交换超节点的单位成本仅为NVL72的31%✿◈,GPU冗余率比NVL72和TPUv4低一个数量级✿◈,且与NVIDIA DGX(单机8卡)相比✿◈,模型算力利用率最高提升3.37倍✿◈。
(注✿◈:曦智科技联手北京大学✿◈、阶跃星辰的研究团队提出了一种以光交换(OCS)模组为中心的高带宽域架构InfiniteHBD✿◈,该方案以论文形式被国际通信网络领域顶级会议SIGCOMM 2025接收✿◈。)
沈亦晨✿◈:目前✿◈,我们已与国内头部芯片厂商建立了深度合作关系✿◈。各厂商根据自身需求选择适配的技术路径✿◈:有些GPU厂商会优先采用电互连方案✿◈,追求单机柜内的密度最大化✿◈;而另一些则更倾向于尝试新技术✿◈,以构建更大规模的超节点✿◈。此外✿◈,新兴的非传统GPU架构厂商也为我们提供了重要机遇✿◈,携手探索创新的解决方案✿◈。
光电融合这块✿◈,因为英伟达马上要推出下一代CPO了✿◈,所以整体上今年的关注度比去年高很多✿◈,但我觉得市场还没有到广泛接受的地步✿◈。这毕竟是一个新的东西✿◈,大家会担心光模块的稳定性✿◈、成本和生态✿◈。
但现在国内的CPO产业链已成熟✿◈,特别是在上游厂商开始纷纷入局以后✿◈,CPO的全面落地是指日可待的✿◈。
沈亦晨✿◈:目前✿◈,我们在数千张GPU卡规模集群的实际部署中✿◈,光互连方案表现良好✿◈,其部署复杂度甚至低于传统电互连方案✿◈。原因在于✿◈:例如英伟达的电互连超节点✿◈,其机柜✿◈、承重✿◈、散热及供电均需高度定制化✿◈,与标准数据中心机房存在显著差异✿◈,往往需要为此专门新建机房✿◈。
而光互连方案则能无缝兼容现有数据中心基础设施✿◈。通过部署光缆✿◈,即可快速组建超节点✿◈。因此在总体成本方面✿◈,光互连并不必然高于电互连✿◈。另外✿◈,尽管系统总发热量相近✿◈,但将功耗分散至多个机柜的方案✿◈,相比将所有高功耗设备集中在一个机柜内✿◈,显著降低了散热难度✿◈。
沈亦晨✿◈:我相信未来国内的超节点一定是跨越一个机柜的✿◈,因为国产GPU无法在单个机柜内实现对标NVL 72的算力✿◈。光与电的本质区别在于光可以连得更远✿◈,铜导线受物理定律限制✿◈,传输同样的高带宽信号时✿◈,能传输的距离较短✿◈,最多只能支持一个机柜内GPU的互连✿◈。所以一旦要跨越一个机柜✿◈,就会不得不用光✿◈。
英伟达今年GTC也推出了两款CPO(共封装光学)交换机✿◈,所以我们认为英伟达以后也会切到光互连上✿◈。虽然黄仁勋一直说我们会尽量用电(互连)直到“we have to”(我们不得不)✿◈,但他们马上也会到“have to”用光(互连)的阶段✿◈。
现在博通✿◈、英伟达✿◈、AMD✿◈、英特尔等主流厂商都在做光互连✿◈,因为单颗芯片所需要的带宽越来越大✿◈,就必须极大缩短铜导线的距离✿◈,而这已经马上到极限了✿◈,所以一定会转成光出来✿◈,去支持更大的算力✿◈。
《21世纪经济报道》✿◈:黄仁勋认为英伟达在CPO技术上至少有二十年的工作可以做✿◈。你认为CPO技术的发展会是一个多长周期?
沈亦晨✿◈:确实✿◈,我觉得未来20年芯片全部会用光来连接✿◈。但光互连技术也会有一个进阶路径✿◈:最开始是把光电转换的光芯片放在电芯片边上(NPO/OBO)✿◈,往后把它们放在同一封装内(CPO)新报跑狗✿◈,最后可能会变成“上下楼”(3D CPO)✿◈,再往后可能会在上面再叠各种东西✿◈,比如激光器✿◈。
所以光电融合技术的发展和半导体技术的发展其实是一样✿◈,都有一个非常长的时间节奏✿◈,不断地去迭代✿◈。我觉得CPO的互连带宽至少还会有1-2个数量级的提升空间✿◈。应该从下一代芯片开始✿◈,CPO就会成为一个共识✿◈。
《21世纪经济报道》✿◈:曦智最近联合燧原科技推出了国内首款xPU-CPO光电共封装原型系统✿◈,是国内首次采用CPO技术实现GPU直接出光的案例✿◈。技术上的难点与创新点在哪里?
沈亦晨✿◈:这是国内第一个使用短距离SerDes技术✿◈,将光学引擎与计算芯片(xPU)在基板上实现光电共封装的系统✿◈。短距离SerDes技术能把电芯片与光芯片的传输距离缩短✿◈,从而大大增加了出口带宽密度✿◈。
无论是光互连电交换还是光互连光交换✿◈,光芯片与GPU芯片一般都在一个板卡上✿◈,但不在一个封装里✿◈,中间连接的铜导线大概有几十厘米新报跑狗✿◈。而这个CPO系统是在同一封装里✿◈、两颗芯片靠在一起设计出来的✿◈。这对芯片的集成能力和共同设计能力提出了很高的要求✿◈。
《21世纪经济报道》✿◈:你们原先做光计算时就已经做出了3D CPO✿◈,现在在xPU光互连里做CPO是不是有些降维打击?
沈亦晨✿◈:从技术上来说是的✿◈,我们在光计算上已经实现了电芯片与光芯片的3D共封装✿◈,所以在做光互连的时候✿◈,很多技术我们都已经具备了✿◈。当然有的光互连产品单通道的带宽需要高一些✿◈,但凭借我们的技术累积✿◈,我们能更快地切入✿◈。
沈亦晨✿◈:我觉得在专用领域✿◈,光计算是有机会的✿◈。在先进互连这块✿◈,超节点是一个非常好的机会✿◈,这是一个行业必然的趋势✿◈。所以我们要利用好超节点这波机会✿◈,尽快地推广我们的产品✿◈,让更多的人用起来✿◈。
沈亦晨✿◈:国内GPU市场呈现高度繁荣新报跑狗✿◈,企业众多✿◈。我们预见✿◈,一个创新开放的全新生态正在国内智算领域孕育✿◈。在此生态中✿◈,我们的战略定位清晰✿◈:聚焦于光互连及光芯片相关的核心技术产品创新BALLBET官网✿◈。目前✿◈,我们已在该领域占据有利生态位✿◈。
《21世纪经济报道》✿◈:在英伟达构筑的封闭生态里✿◈,NVlink技术✿◈、Cuda生态等是英伟达的“护城河”✿◈。曦智选择在超节点上走一条开放生态的道路✿◈,在构筑自身的“护城河”方面有怎样的考虑?
沈亦晨✿◈:首先✿◈,推动开放生态建设✿◈,必然要求我们显著降低技术使用门槛✿◈。对此✿◈,我们秉持高度开放的合作理念✿◈。
当然✿◈,在底层核心技术方面✿◈,我们构筑了坚实壁垒✿◈。以光交换模块为例✿◈,其核心芯片我们均实现自主研发✿◈。芯片设计与仿真涉及复杂的光电协同设计与先进封装能力✿◈,目前国内同时具备如此全面能力的企业屈指可数✿◈。
同时✿◈,在系统级适配与工程化落地层面✿◈,我们投入了大量资源✿◈。与系统厂商及GPU厂商的深度适配工作至关重要✿◈。许多工程挑战只有在部署千卡乃至万卡规模集群时才会暴露✿◈,得益于我们在大型集群部署上的领先实践✿◈,我们得以更早预见并解决这些问题新报跑狗✿◈,持续优化方案✿◈。
因此✿◈,总结而言✿◈,持续的工程迭代能力与底层核心技术的自主创新能力✿◈,共同构成了我们真正的✿◈、难以复制的护城河✿◈。
沈亦晨✿◈:我们的联合创始人✿◈、首席技术官孟怀宇博士是我在MIT的同学✿◈。他曾经参与研发了MIT的全球首个片上光互连技术✿◈,我是在光计算项目上✿◈。同批课题组的同学里还有几个也在我们公司✿◈。2017年✿◈,我们成立了曦智✿◈,光计算和光互连成为我们的两条主产品线人的团队✿◈,核心成员由来自麻省理工学院(MIT)的顶尖科学家✿◈,也有拥有丰富半导体行业经验的业界知名人士✿◈,研发人员占比超80%✿◈。BALLBET贝博体育✿◈,半导体设备✿◈,富士康✿◈,BALLBET全站app✿◈,台湾积体电路✿◈,