NVIDIA发布三款中国特供AI GPU:针对出口限制进行精确调整


根据2月2日的最新消息,尽管美国对中国半导体技术的出口限制日益加强,NVIDIA仍然表现出对中国市场的坚持和积极态度。为了适应持续变化的出口管制规则,NVIDIA不断推出符合限制要求的中国特供AI GPU,第二波产品的三款新卡正在陆续到来。

在面对美国对A100、H100这类高端GPU的禁售政策后,NVIDIA推出了A800和H800这两款特供产品。虽然这两款产品的传输带宽有所缩减,但它们的计算力并未减弱。不过,随着美国政府对AI GPU的算力也施加了限制,包括A800、H800以及RTX 4090在内的产品都受到了影响,因此不能销售给中国客户。NVIDIA的应对策略是在游戏卡市场推出了RTX 4090D,并已经低调上市。

而在AI加速领域,NVIDIA带来了H20、L20和L2这三款新产品。虽然原计划是在2023年发布和出货,但为了完全遵守出口管控政策,发行时间不得不推迟了一段时间。H20是一款基于最新Hopper架构的高性能AI训练卡,非常适合中国客户的需求。最新报道显示,H20已经开始在中国小批量供货,预计在第二季度会有更大量的发放。

价格方面,H20的报价在1.2至1.5万美元之间,比中国华为的昇腾910B的1.7万美元要更加实惠。NVIDIA这种针对性的价位设定,充分体现了其在市场策略和客户需求方面的精确调整。由于H20的强大配置,其在市场上的竞争力十分明显,它拥有296T的INT8/FP8 Tensor算力、148T的BF16/FP16 Tensor算力、74T的TF32 Tensor算力、44T的FP32算力以及1T的FP64算力。

值得注意的是,比起之前的模型,例如H200,H20在技术参数方面有了大幅削减,例如在很多不同的性能指标上减少了高达93%,FP64甚至减少了97%,但FP32性能减幅较小,仅为35%。尽管如此,H20的FP32性能仍无法匹敌华为的昇腾910B,但它可以通过八卡并行架构组成一个HGX服务器,价格大约为20万美元,这比之前需要28万美元的H800服务器来得更加经济。

L20和L2这两款基于Ada Lovelace架构的AI推理卡,目前尚不清楚是否已经开始供货。L20是一款双插槽全高全长的PCIe扩展卡,配备96MB二级缓存和48GB GDDR6 ECC内存,带宽高达864GB/s,而其INT8/FP8算力为239T,更高精度的算力逐级降低,但不支持FP64,功耗为275W。L2则为单插槽半高卡型,拥有36MB二级缓存和24GB GDDR6 ECC内存,带宽为300GB/s,但其算力更低,INT8/FP8算力为193T,FP32算力减半仅为24.1T。

总体而言,这三款AI GPU的推出,不仅反映了NVIDIA灵活应对市场和政策变化的能力,更显示出其在中国市场中的使用独特策略和高度的专业精神。随着这些特供产品的投放,中国市场在AI芯片领域的选择将更加多样化,有助于中国企业在遵守美国出口限制的同时,继续推动技术创新和市场发展。

相关新闻