【导(dǎo)语(yǔ)】日前,是德科技举办算力新品发布会,推出了采样示波器、1.6T互联与网络性能分析仪及数据中心构建器三款新品。随着AI产业从“小模型实验”向“大算力工业化”转变,全球AI市场规模预计将在2030年达到1.3万亿美元。然而,算力中心在高速发展的同时也面临着物理层极限突破、网络层复杂系统脆弱性及能效与可靠性悖论等挑战。为应对这些难题,是德科技提出从“单点测试”到“全栈验证”的破局思路,并发布了KAI解决方案。展望未来,随着CPO、硅光互联等技术成熟,测试测量将向系统级性能预测及设备智能化两大趋势发展。
日前,是德科技举办针对算力新品发布会,发布了采样示波器、互联与网络性能分析仪(1.6T)、数据中心构建器(DCB)三款产品。是德科技大中华区高速数字市场部经理李坚在发布会上表示:“2025年的AI产业正经历从‘小模型实验’到‘大算力工业化’的质变。”根据Bloomberg预测,全球AI市场规模将从2022年的869亿美元爆发至2030年的1.3万亿美元,年复合增长率达35.7%。这一进程中,以万卡集群为代表的算力中心成为核心基(jī)础(chǔ)设(shè)施(shī),单(dān)是(shì)十(shí)万(wàn)卡(kǎ)规(guī)模(mó)的(de)GPU集群(qún),硬(yìng)件成本便突破200亿元,年耗电量相当于一座中等城市(约为1.59太瓦时)。然而,高速化背后隐藏着深层技术矛盾。

是德科技人工智能(KAI)系列解决方案
首先是物理层极限突破的阵痛,当以太网从800G向1.6T/3.2T演进、DDR内存从8.4GT/s迈向HBM3的12.8GT/s,传统PCB板因信号损耗超限被淘汰,转而依赖铜缆/光缆互联。但这带来新挑战,光模块在224Gbps速率下,温度每波动1℃便可能导致误码率飙升;GPU板卡间的无源铜缆虽成本仅为光模块的1/10(百美元级vs数千美元),却需要在100Gbps以上速率下实现低至0.1dB的插入损耗控制。
其次是网络层复杂系统的脆弱性。AI算力网络的“东西流量”占比已超60%,万卡集群中5000+线缆的连接复杂度,使得硬件故障率较传统数据中心提升3~5倍。实测数据显示,GPU真正用于计算的时间仅占36%,43%的训练任务因网络阻塞或硬件故障在4小时内失败。李坚指出,在以往十万卡集群的案例中,因光模块温度漂移导致的训练中断,每年造成的直接经济损失超2亿美元。
最后是能效与可靠性的双重悖论。为支撑大模型训练,算力中心需在3~5年内完成从PCIe 5.0(32GT/s)到PCIe 7.0(128GT/s)的两代跃迁,但这使单卡功耗从300W跃升至800W以上。如何在提升带宽4~8倍的同时,将系统能效比(TOPS/W)提升50%,成为产业共同难题。

是(shì)德(dé)科(kē)技(jì)大(dà)中(zhōng)华(huá)区(qū)高(gāo)速(sù)数(shù)字(zì)市(shì)场(chǎng)部(bù)经(jīng)理(lǐ) 李(li)坚(jiān)
为(wèi)了(le)应(yīng)对(duì)这(zhè)些(xiē)难(nán)题(tí),是德科技的破局思路是从“单点测试”到“全栈验证”,研发出了KAI(Keysight AI)解决方案给出系统性答案。李坚表示,展望2030年,随着CPO(光电共封装)、硅光互联等技术走向成熟,测试测量将呈现两大趋势:一是从“单一参数测试”转向“系统级性能预测”,通过AI驱动的仿真模型,在设计阶段精准预测复杂系统的实际表现;二是测试设备本身的智能化,如集成生成式AI算法,自动生成最优测试用例,将工程师从重复性劳动中解放出来,聚焦于创造性突破。
