HPC优化难题如何解之AMD篇

Doserv原创 Vicky Z 发表于:10年08月09日 09:29 [原创] 服务器在线

  • 分享:
[导读]在现有IT基础上对HPC进行充分利用已经成为业界关注的核心主题,优化HPC更是重中之重,本次我们服务器在线以此为题将会做一个系列的访问。
DoSERV记者:从某种意义上讲,内存是CPU与I/O设备沟通的一个巨大的缓冲区,是最为繁忙的数据跳转站,而如果想要充分发挥CPU的浮点运算性能,充足的内存带宽是必不可少的。而CPU作为HPC的核心,也必须拥有足够的内存通道,AMD在这方面有着那些准备和计划?还有在处理器架构和协处理器设计上,AMD采取了怎样的方式对内存通道进行优化呢?这样的优化能够为整个HPC的优化带来怎样的影响?

刘文卓先生:这个问题很好。在目前的计算机体系结构中,CPU核心速度最快,其次是二级缓存,然后是三级缓存,然后是内存,硬盘最慢,内存与缓存之间有着数量级上的速度差别。03年,AMD就推出了直连架构,就是为了提高内存的访问速度。直连架构、内存控制器对提升CPU的总体效能有很大帮助。

AMD在最新的12核处理器中将内存通道从原来的两个增加到了4个。要想提升浮点运算效能,就要把浮点运算单元中的管道尽量灌满,而内存通道越多它就灌得越快,算得也就越快。而如果用GPU加速运算,就会存在大量数据从CPU的主存复制到GPU的显存中的一个传输问题,它算完了还要复制回来,这个来回的传输比较占用时间。在现在体系结构上,把大规模的数据扔给GPU去算,要尽量让它算时间长一些再传回来,这样的模式会比较合算。因为如果传给GPU数据的时间超过了CPU自己算出结果的时间,那就不合算了。还有如果让它做迭代或递归这样的复杂计算也不行,为什么呢?我们都知道GPU是做流计算的,显示屏上的每个像素都是算出来的,而且每个像素之间都没有逻辑关系。所以GPU比较适合处理并行数据,就是那种没有横向相关性的数据和任务。比如像加密和解密这样的数据之间无逻辑关系的数据以及分子动力学的数据等等,都比较适合它来做计算。

现在AMD计划在台式机笔记本中推出的Fusion芯片会将CPU、GPU整合在一起,让它共享内存控制器。不是常规的通过PCI-E总线传数据,而是通过内存通道来传送数据,这样一来就可以解决刚才所说那个传输过程耗费时间的问题。我们现在做的第一个版本CPU和GPU的数据还是分开来存,第二版的Fusion将会把采用数据共享的方式,消除了数据拷贝的代价。,我们未来计划在服务器上也这么做。不过,服务器需要更好的稳定性还有OpenCL这样的开放环境,所以就比较复杂。




[责任编辑:査彬]
Doserv原创 Vicky Z
纵观IT发展的历程,我们发现IT技术从最早的分布式结构走向了大集中的架构,而今,云计算的出现又将IT重新引向了分布式的老路。
官方微信
weixin
精彩专题更多
联想发布“腾云计划”正式进入云市场,同时推出ThinkServer Gen5,在众说纷“云”的云时代里联想推出云战略正当其时,服务器产品线的更新便是联想云时代里前行的新生力量。
2014年11月6号,HPC China 2014大会在广州长隆酒店正式召开。本次会议由中国计算机学会主板,中国计算机学会高性能计算专业委员会、中山大学和广东工业大学承办。
思科UCS:突破性能极限 重新定义平台
 

公司简介 | 媒体优势 | 广告服务 | 客户寄语 | DOIT历程 | 诚聘英才 | 联系我们 | 会员注册 | 订阅中心

Copyright © 2013 DOIT Media, All rights Reserved.