SPEC宣布取消Intel逾2600项官方性能测试结果


2月17日傳來的計算機科技界重要消息,专注于第三方计算机标准化基准测试的非盈利组织SPEC,正式宣布作废逾2600项关于Intel处理器的官方测试结果。此项突发变动源于这些测试成绩是基于专门针对特定测试项目的Intel编译器优化而来,涉嫌使性能评分不公正。

SPEC CPU 2017基准测试广泛应用于评估从高端数据中心、服务器、工作站到PC电脑等各类计算设备的性能。其测试过程依据一系列标准化方法,通过各种不同工作负载,不仅检验了硬件的性能,也检验了支持这些硬件所需的软件优化和编译器的能力。

作为软件优化中不可或缺的环节,编译器对代码进行处理、编排,确保处理器可以以最优的方式运行。这一次SPEC取消了Intel的2600多项测试成绩,是由于其所采用的Intel oneAPI DPC++/C++编译器对523.xalancbmk_r和623.xalancbmk_s两个测试项目做出了特殊编译优化,导致处理器性能的测试结果不正常地偏高。此问题影响了2022.0到2023.0版本的编译器,而大部分测试成绩都是来源于2022年使用的Sapphire Rapids第四代至强处理器。顺提,刚刚发布的Emerald Rapids第五代至强处理器并不包含在受影响范围内。

有关特殊优化影响测试成绩的讨论历来是个争议焦点。根据Phoronix的测试数据显示,Intel进行优化后,SPECint的评测性能平均提升了9%。而类似优化问题远不止于Intel一家,NVIDIA和AMD等其他硬件制造商也曾因类似行为遭遇质疑。例如,在2003年NVIDIA因为驱动优化而提升了其显卡在3DMark 2003测试中的得分。而到了2010年,NVIDIA则反过来指责AMD为了换取游戏更佳画质,在驱动中关闭了特定功能而损失了一些性能。

尽管此类行为有时是为了体现产品在特定场景下的最佳表现,但也引发了公众对于性能测试标准和公正性的深度讨论。在性能测试频频被当作市场营销工具的今天,如何确保公平和透明的基准测试,以及如何防止特殊优化手段扭曲测试结果,成为整个硬件制造业必须面对的重大问题。尤其当Intel Arc锐炫显卡面市,出现了在3DMark跑分中得分高而实际游戏体验并不匹配的情况时,更是激发了公众对于测试准则真实性的疑问。随着SPEC的这一决定,行业或许会因此开始重新审视和调整测试标准,以期达到更公正、更真实反映产品性能的测试结果。

相关新闻