TOP100:混合架构助中国迈入千万亿次
DOIT原创 崔昊 发表于:09年11月02日 09:39 [原创] 服务器在线
DOIT多易网 HPCChina2009 长沙现场报道: 随着张云泉博士所作报告《2009年中国高性能计算机发展趋势分析与展望》的发布,在中国HPC最受瞩目的榜单:中国高性能计算TOP100,于今天在湖南长沙正式发布,出人意料的是,作为本次TOP100活动的最大“黑马”,貌不惊人且此前从未经人透露过的由国防科技大学设计、制造的天河一号,以突破千万亿次的惊人性能,获得了本次TOP100排行榜的“状元”,而这也是经过多年对HPC领域的研发后,国防科技大学首次登顶TOP100排行榜榜首。
作为863 “高效能计算机及网格服务环境”重大项目“千万亿次高效能计算机系统研制”课题成果,国防科技大学自主设计、研发、生产的天河一号由国防科技大学与天津滨海新区合作,将作为国家超级计算机天津中心的业务主机,部署于天津市滨海新区,成为中国国家网格计算的主节点。
本次TOP100的推出,意味着中国已经拥有自己的PFlops级别(Peak值,以下同)超级计算机,成为全球第二个拥有同类超级计算机集群的国家,而本次榜单的许多亮点,也让中国TOP100成为了2009年中国高性能计算行业、服务器行业、芯片行业最为突出的一次会议,而其中所显露出的一些特点则显示了中国高性能计算领域的发展和独特的设计思路。
天河一号:效率仅及最高者一半?
在本次榜单中位列第一的天河一号自然引起了与会者的极大兴趣,而包括服务器在线在内的诸多与会媒体都对这个“横空出世”的千万亿次超级计算机感到不可思议,在本次会议前,媒体纷纷猜测曙光5000A将以多大的性能提升来显示曙光在系统调优方面的新进展,但是,在迈入会场之后,发现一套名为天河一号的HPC摆在会场中,许多媒体已经看出了端倪。
天河一号的出现吸引了许多媒体的目光,从目前披露的相关资料和TOP100榜单显示,天河一号峰值性能达到每秒1206万亿次双精度浮点运算,拥有6144个英特尔至强处理器,以及5120个加速处理器,内存总容量高达98TB,点到点通信带宽为40Gbps,共享磁盘总容量为1PB。
在节点方面,天河一号由2560个计算节点组成,每个节点采用两个英特尔四核至强5500系列处理器,配备32GB内存,此外共有512个服务节点和2560个加速节点。
但是,令人们吃惊的是,天河一号虽然Linpack数值达到了563.1Tflops,系统效能也超过2009年6月发布的Green500第五位,达到431.7MFlops/w,但是效率却仅为0.467,不仅普遍低于本次TOP100排行榜上的其他高性能计算系统,更是比第七名,南京大学的高性能计算系统的0.920的效率,低接近50%。
在发现这一情况后,记者迅速查看了天河一号的互联通信子系统的情况,发现天河一号采用两级Infiniband QDR互联,单个通信链路的通信带宽为40Gbps、延迟1.2μs,这远比大量采用10GbE互联的高性能计算系统的效率还要低(一般采用GbE连接的HPC效率能够达到0.5以上,而如果采用Infiniband,则一般都会在0.7以上,甚至会达到南京大学那台采用400x2的英特尔至强5550+Infiniband系统的0.92)
由于天河一号由国防科技大学研发,很多技术和特性上仍然受到保密协议的管理,在有媒体请求采访相关领导或工程师时,基本上都遭到了委婉的谢绝,并表示会在适当时候更多的披露,而在记者致电国防科技大学方粮博士时,也了解到国防科技大学对于天河一号的重视,以及很多技术细节上目前是否能够披露还需要假以时日。
不过,对于天河一号的效率问题,有相关人士猜测,其可能基于国家科研、实验的考虑,采用了国内自主研发的互联系统,而Infiniband的说法不过是“部分采用”,而由于技术尚未成熟,可能其效率受到其制约不能完全发挥出来。
而从其他途径,服务器在线记者了解到,天河一号的效率问题很可能与其所采用的混合计算架构有关——天河一号除了采用英特尔至强5500系列处理器之外,还采用了ATI Radeon处理器(也就是通常我们所说的GPU)作为加速单元,而混合计算系统在Peak数值上面虽然可以突破千万亿次,但是在效率上面很可能会出现这样的较低效率——事实上,此前在媒体采访中,已经有国外的一些案例证实,非混合计算系统,比如全部采用至强5500+Infiniband的组合,其效率甚至能够达到0.9。
当然,这也是排行榜上首次出现CPU+GPGPU混合加速的PFlops机器,对于混合计算尤其是图形计算等特殊领域的需求,并不妨碍天河一号这样的混合计算系统发挥其强大的计算性能。
