最新好文

NVIDIA发布三款中国特供AI GPU：针对出口限制进行精确调整

最新好文
2月 2, 2024
12:12 下午

根据2月2日的最新消息，尽管美国对中国半导体技术的出口限制日益加强，NVIDIA仍然表现出对中国市场的坚持和积极态度。为了适应持续变化的出口管制规则，NVIDIA不断推出符合限制要求的中国特供AI GPU，第二波产品的三款新卡正在陆续到来。

在面对美国对A100、H100这类高端GPU的禁售政策后，NVIDIA推出了A800和H800这两款特供产品。虽然这两款产品的传输带宽有所缩减，但它们的计算力并未减弱。不过，随着美国政府对AI GPU的算力也施加了限制，包括A800、H800以及RTX 4090在内的产品都受到了影响，因此不能销售给中国客户。NVIDIA的应对策略是在游戏卡市场推出了RTX 4090D，并已经低调上市。

而在AI加速领域，NVIDIA带来了H20、L20和L2这三款新产品。虽然原计划是在2023年发布和出货，但为了完全遵守出口管控政策，发行时间不得不推迟了一段时间。H20是一款基于最新Hopper架构的高性能AI训练卡，非常适合中国客户的需求。最新报道显示，H20已经开始在中国小批量供货，预计在第二季度会有更大量的发放。

价格方面，H20的报价在1.2至1.5万美元之间，比中国华为的昇腾910B的1.7万美元要更加实惠。NVIDIA这种针对性的价位设定，充分体现了其在市场策略和客户需求方面的精确调整。由于H20的强大配置，其在市场上的竞争力十分明显，它拥有296T的INT8/FP8 Tensor算力、148T的BF16/FP16 Tensor算力、74T的TF32 Tensor算力、44T的FP32算力以及1T的FP64算力。

值得注意的是，比起之前的模型，例如H200，H20在技术参数方面有了大幅削减，例如在很多不同的性能指标上减少了高达93%，FP64甚至减少了97%，但FP32性能减幅较小，仅为35%。尽管如此，H20的FP32性能仍无法匹敌华为的昇腾910B，但它可以通过八卡并行架构组成一个HGX服务器，价格大约为20万美元，这比之前需要28万美元的H800服务器来得更加经济。

L20和L2这两款基于Ada Lovelace架构的AI推理卡，目前尚不清楚是否已经开始供货。L20是一款双插槽全高全长的PCIe扩展卡，配备96MB二级缓存和48GB GDDR6 ECC内存，带宽高达864GB/s，而其INT8/FP8算力为239T，更高精度的算力逐级降低，但不支持FP64，功耗为275W。L2则为单插槽半高卡型，拥有36MB二级缓存和24GB GDDR6 ECC内存，带宽为300GB/s，但其算力更低，INT8/FP8算力为193T，FP32算力减半仅为24.1T。

总体而言，这三款AI GPU的推出，不仅反映了NVIDIA灵活应对市场和政策变化的能力，更显示出其在中国市场中的使用独特策略和高度的专业精神。随着这些特供产品的投放，中国市场在AI芯片领域的选择将更加多样化，有助于中国企业在遵守美国出口限制的同时，继续推动技术创新和市场发展。