HPC优化难题如何解之AMD篇

Doserv原创 Vicky Z 发表于:10年08月09日 09:29 [原创] 服务器在线

  • 分享:
[导读]在现有IT基础上对HPC进行充分利用已经成为业界关注的核心主题,优化HPC更是重中之重,本次我们服务器在线以此为题将会做一个系列的访问。
DoSERV记者:如果从技术上来讲,AMD的芯片在HPC优化上能够起到什么作用呢?

刘文卓先生:目前来讲,我认为功耗和性能是困扰HPC的两大难题。以之前我们合作伙伴曙光5000A超级计算机为例,他们告诉我这台机器仅一天的用电费用就达到了1.6万到2万元,而现在我们的能源又那么紧缺,所以功耗的节省成为了HPC优化的核心问题。我们AMD 8/12核的产品不但性能有几乎两部的提升,而且可以为HPC应用动态降低能耗,它可以根据不同的应用关掉暂时无负载的核心,当机房供电能力不够的时候可以对系统进行功耗上限设置,或者通过AMD的PowerNow!等技术来完成能耗的节省。

DoSERV记者:现在有很多超级计算机都采用了CPU+GPU的混合计算模式,AMD在这个趋势上也是领军者之一,是什么促使AMD认为这种模式可以为HPC带来更大的性能提升呢?在这种处理器架构模式上,AMD是怎么考虑和设计的呢?

刘文卓先生:CPU按照我们常用的摩尔定律来说,一般的更新换代时间是18个月,也就是说它能够在18个月后性能就可以翻一番。而GPU的更新速度是CPU的1.5倍,也就是说通常12个月的时间GPU的性能就翻了一番。大概五年前,CPU和GPU的晶体管数量是差不多的,而现在AMD的GPU的最顶端产品拥有超过20亿个晶体管,我们AMD的四核CPU产品有超过7亿多个晶体管,这样一来差距已经差出很多来了。CPU相对来说体系结构复杂很多,有计算单元,有缓存,还有其他的逻辑部件如分支运算的预测等工作,而GPU则相对简单,大部分是应用在显示运算上的。

GGPU里面大约有超过40%是逻辑运算单元,而CPU只有5%是逻辑运算单元,所以说单纯从运算速度来说,发展到现在,GPU比CPU要快很多。像我们的最快的12核心的皓龙CPU,主频2.3GHz,运算峰值为110.4Gflops。而我们最快的GPU Radeon HD 5970,含有3200个流计算单元,单精度32位的运算峰值速度是4.64Teraflops,是CPU的42倍,双精度64位是CPU 的8倍。对于一些特殊应用,其加速比甚至可以上百倍。刚才讲的能耗问题,我们造一个超级计算机一天就要消耗掉2万元人民币的电,如果采用GPU的话,整个系统的规模就可以大大降低,同样的计算能力GPU可以把能耗降到1/5或不到一半的规模。

AMD中国区技术总监刘文卓先生在AMD产品展区

像上次我在国外开的一个超算会议,研究GPU运算在国外很火,超过一半的HPC的应用研发都集中在GPU上,大家都在研究如何在GPU上计算。其实对编程人员来说,在GPU上是很难做编程的,因为它的设计是为显示用的,不是做计算的。但发展到现在,它的每瓦性能又确实很高,所以大家都在努力做编程以及迁移。

而我们在这方面,AMD整合了ATI,所以在GPU技术上有着得天独厚的优势。不过,就目前来讲,要把这样的模式用好还很困难,我国的天河一号就采用了这种模式,但是要完全用好和充分发挥GPU的计算力至今还是一个难题,所以这里面还有很长的路要走。

我们正在笔记本和台式机上开发一些利用GPU做加速运算的应用,到明年我们的新的Fusion平台发布的时候大家就能看到,非常值得期待。,相信未来也可以迁移到服务器平台。所以从此可以看出来,GPU+CPU是肯定要做的事,而且日后也肯定会迁移到这个平台上面。


[责任编辑:査彬]
Doserv原创 Vicky Z
纵观IT发展的历程,我们发现IT技术从最早的分布式结构走向了大集中的架构,而今,云计算的出现又将IT重新引向了分布式的老路。
官方微信
weixin
精彩专题更多
联想发布“腾云计划”正式进入云市场,同时推出ThinkServer Gen5,在众说纷“云”的云时代里联想推出云战略正当其时,服务器产品线的更新便是联想云时代里前行的新生力量。
2014年11月6号,HPC China 2014大会在广州长隆酒店正式召开。本次会议由中国计算机学会主板,中国计算机学会高性能计算专业委员会、中山大学和广东工业大学承办。
思科UCS:突破性能极限 重新定义平台
 

公司简介 | 媒体优势 | 广告服务 | 客户寄语 | DOIT历程 | 诚聘英才 | 联系我们 | 会员注册 | 订阅中心

Copyright © 2013 DOIT Media, All rights Reserved.