HPC优化难题如何解之AMD篇

Doserv原创 Vicky Z 发表于：10年08月09日 09:29 [原创] 服务器在线

分享：

[导读]在现有IT基础上对HPC进行充分利用已经成为业界关注的核心主题，优化HPC更是重中之重，本次我们服务器在线以此为题将会做一个系列的访问。

DoSERV记者：如果从技术上来讲，AMD的芯片在HPC优化上能够起到什么作用呢？

刘文卓先生：目前来讲，我认为功耗和性能是困扰HPC的两大难题。以之前我们合作伙伴曙光5000A超级计算机为例，他们告诉我这台机器仅一天的用电费用就达到了1.6万到2万元，而现在我们的能源又那么紧缺，所以功耗的节省成为了HPC优化的核心问题。我们AMD 8/12核的产品不但性能有几乎两部的提升，而且可以为HPC应用动态降低能耗，它可以根据不同的应用关掉暂时无负载的核心，当机房供电能力不够的时候可以对系统进行功耗上限设置，或者通过AMD的PowerNow!等技术来完成能耗的节省。

DoSERV记者：现在有很多超级计算机都采用了CPU+GPU的混合计算模式，AMD在这个趋势上也是领军者之一，是什么促使AMD认为这种模式可以为HPC带来更大的性能提升呢？在这种处理器架构模式上，AMD是怎么考虑和设计的呢？

刘文卓先生：CPU按照我们常用的摩尔定律来说，一般的更新换代时间是18个月，也就是说它能够在18个月后性能就可以翻一番。而GPU的更新速度是CPU的1.5倍，也就是说通常12个月的时间GPU的性能就翻了一番。大概五年前，CPU和GPU的晶体管数量是差不多的，而现在AMD的GPU的最顶端产品拥有超过20亿个晶体管，我们AMD的四核CPU产品有超过7亿多个晶体管，这样一来差距已经差出很多来了。CPU相对来说体系结构复杂很多，有计算单元，有缓存，还有其他的逻辑部件如分支运算的预测等工作，而GPU则相对简单，大部分是应用在显示运算上的。

GGPU里面大约有超过40%是逻辑运算单元，而CPU只有5%是逻辑运算单元，所以说单纯从运算速度来说，发展到现在，GPU比CPU要快很多。像我们的最快的12核心的皓龙CPU，主频2.3GHz，运算峰值为110.4Gflops。而我们最快的GPU Radeon HD 5970，含有3200个流计算单元，单精度32位的运算峰值速度是4.64Teraflops，是CPU的42倍，双精度64位是CPU 的8倍。对于一些特殊应用，其加速比甚至可以上百倍。刚才讲的能耗问题，我们造一个超级计算机一天就要消耗掉2万元人民币的电，如果采用GPU的话，整个系统的规模就可以大大降低，同样的计算能力GPU可以把能耗降到1/5或不到一半的规模。

AMD中国区技术总监刘文卓先生在AMD产品展区

像上次我在国外开的一个超算会议，研究GPU运算在国外很火，超过一半的HPC的应用研发都集中在GPU上，大家都在研究如何在GPU上计算。其实对编程人员来说，在GPU上是很难做编程的，因为它的设计是为显示用的，不是做计算的。但发展到现在，它的每瓦性能又确实很高，所以大家都在努力做编程以及迁移。

而我们在这方面，AMD整合了ATI，所以在GPU技术上有着得天独厚的优势。不过，就目前来讲，要把这样的模式用好还很困难，我国的天河一号就采用了这种模式，但是要完全用好和充分发挥GPU的计算力至今还是一个难题，所以这里面还有很长的路要走。

我们正在笔记本和台式机上开发一些利用GPU做加速运算的应用，到明年我们的新的Fusion平台发布的时候大家就能看到，非常值得期待。，相信未来也可以迁移到服务器平台。所以从此可以看出来，GPU+CPU是肯定要做的事，而且日后也肯定会迁移到这个平台上面。

[责任编辑：査彬]

从分布到大集中富士通坐看存储风云趋势

纵观IT发展的历程，我们发现IT技术从最早的分布式结构走向了大集中的架构，而今，云计算的出现又将IT重新引向了分布式的老路。

官方微信