HPC优化难题如何解之AMD篇
Doserv原创 Vicky Z 发表于:10年08月09日 09:29 [原创] 服务器在线
刘文卓先生:多核肯定是一个趋势,我们除了今年的8/12核马尔库尼产品外,在明年还会推出推土机系列芯片,每个CPU的核心数量达到16核
。纯粹追求主频的技术路线已经证明是行不通的,因为无法解决CPU的功耗问题。其实单线程频率的提高是有意义的,但是在没办法把主频推到最高的时候,只能采用多核心来分担处理任务的负担。当然了,太多核心也会碰到问题,核心之间沟通的开销也会比较大,所以在我们做到16核的时候在考虑利用GPU来做加速运算。
云计算是一个确定的发展趋势。举个例子,像我们过去会将银子埋存起来,后来怕被偷就有了钱庄以及银行。以前各个地方都是打井,现在就变成了自来水。现在我背着本到处跑,背着内存硬盘等等,以后我就不需要一直带着这些东西,我只要把这些东西都存在后台就好了。这就是一个很明显的事,像现在我们会把照片放到网上,还有电子邮件等等,都是典型的云应用。
由于云计算涉及的系统数量特别大,多则能够到数十万台服务器。在构建这样的数据中心或云中心时,首先考虑的就是功耗问题,其次是价格问题,最后是性能够不够用的问题。而且云计算里很多互联网的应用中,CPU的使用率都不会超过30%,这样一来,我们的4/6核的皓龙4000系列处理器就正好能够满足这种大规模数据中心的应用了。如果运算上的需求很高,也可以用我们的皓龙6000系列,可以充分满足他们的计算需求。所以未来是这样的一个发展趋势。
DoSERV记者:据我所知一般芯片厂商都会为芯片产品提供一些相关技术的支持,比如推出编译器,增强系统性能等等,在这方面AMD有哪些产品可以作为支持呢?还有在这种编译器的设计上能够对编译性能的优化起到那些帮助呢?
刘文卓先生:在软件上呢,其实X86的编译器已经很成熟了。我们采用的是Open64这样的开源软件,AMD在上面做了很多编译器上的调优、适合多核的一些优化选项、数学库等等,根据我们AMD产品上的一些特性与软件做结合。在GPU加速运算方面我们推广业界标准OpenCL这样的编程环境。现在我们也在考虑与国内的一些软件企业和研究机构合作,因为这些年来我国的软件水平有了很大的提高。
DoSERV记者:那刚才谈的编译性能能够对HPC的优化起到什么样的作用?
刘文卓先生:编译器对实际应用的优化是很重要的,有很多现实的案例,,我们的工程师只要在编译器上修改一两个选项,整个系统的性能就会有很大的提升,尤其是在多核应用中,有的程序编得不好,只能用到1-2个核心,但现在我们就可以充分利用所有的12个核心。以前,设计CPU的时候都是把指令集做完后再做编译优化,我们自从巴塞罗那处理器以后在设计下一代CPU的时候,就跟编译器软件厂商合作,询问他们要加什么指令,然后我们在设计核心的时候就加入进去。
