Nehalem在高性能计算内存测试中取得佳绩
晓黎 发表于:09年07月17日 08:56 [编译] 服务器在线
欢迎阅读软件在线文章《Sybase推出Sybase IQ 15.1数据库》>>
英特尔公司的Nehalem EP处理器在一系列内存深度基准测试中大幅超出AMD的伊斯坦布尔处理器。
超级计算机集群制造商Advanced Clustering Technologies(简称ACT)再次失去对官方基准等待的耐心,在单个服务器节点上运行了他们自己的基准测试,这个服务器节点使用的是整个集群中都使用的常用高性能计算测试。本次ACT公司在双路服务器上使用的是最新的X64处理器,运行的是Stream内存基准。
通过在单个服务器上运行各种不同的高性能计算测试,ACT公司可以让用户知道最新的英特尔四核'Nehalem EP'至强5500处理器和AMD六核伊斯坦布尔皓龙2400处理器的优势和劣势。
几周前,ACT的集群工程师Shane Corder在使用这两款最新处理器的双路服务器上执行了Linpack Fortran基准测试后发表了测试报告。
在那次测试中,ACT公司配置了两个主频为2.66GHZ的四核至强X5500s处理器和12GB,133GHz的DDR3主存的Pinnacle机架服务器可交付的可持续性能为74.03千兆浮点计算能力,理论上的峰值性能可以达到85.12千兆浮点计算能力。但是配置了两个主频为2.6GHz的六核皓龙2435处理器和16GB,800MHz的DDR2主存的Pinnacle服务器可交付的计算性能为99.38千兆浮点计算能力,理论上的峰值性能为124.8千兆浮点计算能力。
因此AMD在本轮对比中胜出,特别是当你把价格因素考虑在内的话--ACT公司搭载皓龙处理器的Pinnacle高性能计算节点售价仅为3500美元,而搭载至强处理器的Pinnacle服务器的售价为3800美元。
目前进行的是Stream基准测试,这项测试测算的不是浮点计算能力而是内存带宽,假使将时钟频率更高的DDR3主存与DDR2主存做对比,你可以预测Nehalem EP服务器节点比在Linpack测试中的表现要好得多。事实也确实如此。
Corder执行的Stream基准测试使用的机型与Linpack基准测试中使用的硬件完全相同,为了获得更好的测试结果,Corder应用了大量过时的四核至强处理器和皓龙处理器来展示新一代的处理器与上一代的处理器相比优势有多么明显。
Nehalem EP处理器在这项测试中确实要胜出伊斯坦布尔处理器。使用1.33GHz的DDR3主存,配置至强X5570处理器的服务器在Stream测试中带宽可以达到每秒37,122MB,配置1.07GHz内存模组的服务器带宽可以达到每秒32,770MB,如果使用800MHz内存可处理的带宽仅为每秒25,490MB。配置早期的"Harpertown"至强5400处理器的Pinnacle服务器(使用过时的前端总线体系架构和800MHz DDR2主存的四核处理器)在Stream基准测试中的带宽仅为每秒9776MB,如果内存时钟频率下降为667MHz,那么带宽就直降为每秒6102MB。
通过对比反差也很大--配置800MHz DDR2主存的伊斯坦布尔处理器的Pinnacle服务器在stream测试中可以达到的内存带宽为每秒20,534MB,这确实比ACT公司在配置四核上海皓龙处理器的Pinnacle服务器上看到的结果要低得多,上海皓龙处理器可以达到的带宽为每秒20,687MB。配置过时的667MHZ DDR2主存的四核巴塞罗那皓龙处理器的服务器在Stream测试中可交付的带宽为每秒16,965MB。
正如英特尔所承诺的,ACT公司确认Nehalem EP处理器和他们最新的QuickPath Interconnect总线体系架构与上一代的Harpertown处理器相比,内存带宽提高了将近四倍,内存性能是目前AMD皓龙处理器的两倍。对此AMD除了在明年初转向DDR3主存外无计可施。
AMD公司将推出每路搭载四个DDR3内存通道的G34芯片组(上升到12个双列直插内存模组)和每路两个内存通道的C32芯片组(上升到四个双列直插内存模组)。AMD公司的计划是提供两种不同型号的双路服务器:一种是以内存带宽为卖点的(就是G34),另一种是以相对便宜的价格和浮点计算能力来吸引用户的,或者说整数计算能力也更加重要(就是C32)。AMD的想法是没错的。但是他们确实需要这种体系架构来应对英特尔令人瞩目的内存带宽优势。
