Convey公司研制混合式核心超级计算机

晓黎 发表于:10年11月30日 09:46 [编译] 服务器在线

  • 分享:
[导读]在新奥尔良市举行的SC10超级计算机大会上探讨的所有内容并非都是围绕图形处理器协处理器的。
DoSERV服务器在线2010年11月30日 国际报道:在新奥尔良市举行的SC10超级计算机大会上探讨的所有内容并非都是围绕图形处理器协处理器的。两年前凭借配置X64处理器和现场可编程门阵列加速器的混合超级计算机强势进军高性能计算领域的Convey Computer公司目前获赠在对他们搭载了新一代现场可编程门阵列加速器的HC-1超级计算机进行更新换代。

Convey Computer的Hybrid Core-1超级计算机并不像其他中央处理器-图形处理器混合型超级计算机那样涵盖所有领域,而是用于某些特定的应用软件,价格更加昂贵的现场可编程门阵列加速器将更加强大,因为它能针超级计算机工作负载对不同的特性进行编程并提高特殊运算法则的速度。之前推出的HC-1超级计算机配置的是Linux操作系统,搭载的是来自英特尔至强5300系列家族的前端总线架构和志强插槽,内置Xilinx Virtex-5现场可编程门阵列。

Convey公司获得了芯片巨头英特尔公司允许其在更加高级的至强5500,5600,6500和7500处理器中使用前端总线和更新的QuickPath Interconnect互联架构的授权。不过他们还没有在新型超级计算机中应用QPI版本。公司的合作创始人兼首席执行官布鲁斯.特里表示"这一天很快就会到来"。

对于在SC10上对外公布的HC-1ex超级计算机,Convey公司正在将其升级为最新的Virtex-6现场可编程逻辑阵列,这样就能提供超过上一代现场可编程逻辑阵列要快将近四倍的速度,与去年中期开始批量推出的HC-1超级计算机相比,运行特殊运算法则的性能要高出两到三倍。

HC-1超级计算机和日前推出的HC-1ex超级计算机基本上配置的都是双路至强服务器并将其中的一个插槽用来匹配其他插槽的协处理器(你可以从我们一年前发布的报告中来了解HC-1体系架构的全部细节信息)。Convey公司此次设计的创新之处在于没有将现场可编程门阵列与中央处理器搭配,而且使用可以将两个设备连接为高速缓存共享虚拟内存空间的定制主板来实现这一点。使用Convey研制的整合式可编程环境,应用软件可以执行X64指令集和一整套以现场可编程门阵列特点呈现的协处理器指令。使用C,C++和Fortran编译器的编程人员可以看到在现场可编程门阵列中执行的额外指令集并在代码中使用这些指令集。

现场可编程门阵列芯片在系统内部有16个内存通道,可以为现场可编程门阵列提供每秒80GB的带宽。HC-1系统主板有四个用于单一X64处理器的双列直插内存模组通道和16个用于现场可编程逻辑阵列的双列直插内存模组通道,通过前端总线体系架构彼此连接在一起,就像至强处理器在双路服务器中彼此互联的方式一样。HC-1超级计算机使用的是优化高速缓存线转换的标准双列直插内存模组(连续读取),也使用了可以优化八字节转换的分散聚集式双列直插内存模组(随机读取)。之前系统所配置的至强处理器最高可以支持32GB主存,8GB双列直插内存模组,系统主板的协处理器方面最高可以支持128GB内存。

对于HC-1ex超级计算机,其所搭载的至强处理器已经被升级为主频2.13GHz的四核至强5400系列处理器,其内存可以达到128GB。HC-1超级计算机的中央处理器也被升级为128B内存,在一个插槽内最高可以容纳四个Xilinx Virtex 5 LX330现场可编程门阵列,HC-1ex超级计算机一个插槽中有四个Virtex 6 LX760现场可编程门阵列。这两款机型目前可以支持128GB的标准DDR2主存和64GB的SG双列直插内存模组。HC-1超级计算机采用的是2U机箱,而HC-1ex超级计算机采用的是3U机箱。两款机型搭载的都是英特尔专门为Convey生产的定制主板,有一个单独的PCI-Express 2.0 x16插槽,一个传输速率为每秒3GB的集成SATA硬盘控制器和两个板上千兆以太网端口。

在介绍一边的四核至强处理器和另外一边大马力现场可编程门阵列,特里表示单个的HC-1ex超级计算机节点是上一代HC-1超级计算机节点功能能力的两到三倍。上一代的HC-1超级计算机目前仍在供应中,售价为25000美元,而更新款的HC-1ex系统售价仅为35000美元。在完成Convey所设计运行的计算工作时的性能却提高了30%到50%。

但是特里认为,更重要的是在完成特定工作负载时,计算机所采用的现场可编程门阵列可以完成指定的计算任务并且没有资源浪费。新款的HC-1ex超级计算机比搭载英特尔双路8核至强处理器的机型要运行更多的工作负载。举例来说,Convey的一个用户需要进行2字节计算,可以用现场可编程门阵列编程来针对2字节注册表完成这项任务。在传统的32位或者64位处理器上,注册表的规模是一样的,芯片上的大部分资源都被浪费了。如果使用通过DNA遗传代码来审核的生物型应用程序,HC-1系统的输出能力就能比搭载上路至强5400处理器的服务器快上25倍,HC-1ex系统的输出能力则要快50倍。

"这些都是HC-1ex系统令人目瞪口呆的地方"特里表示。这些工作负载的性价比优势是巨大的,甚至是在用户为购买Convey节点所支付的高价格上也是如此。根据特里的数据,售价约为250,000美元的8路X64服务器才能匹配一台售价为35000美元的HC-1ex系统(假设配置的是价值5000美元的X64服务器)。从价值上来说提高了7倍。

特里介绍说,目前美国的一家大型国家实验室是Convey公司30家用户之一,迄今为止公司已经吸引了政府机构,生物制药公司和很多希望使用现场可编程门阵列的IT厂商。一些有代表性的用户购买了1到8个HC-1或者HC-1ex节点。

迄今为止,Convey的大部分用户还处在初步试验阶段,这也是Convey公司没有将基础硬件平台大力升级为更加先进的QPI至强系统的原因之一。显然,这些更新的至强处理器和芯片集有着更大的内存带宽,对于那些希望将Convey混合超级计算机用于生产环境的用户来说很具吸引力。

特里没有具体说明公司在不久的将来是否会推出基于英特尔即将问世的"Sandy Bridge"至强处理器的定制双路超级计算机或者将处理器升级为功能更加强大的至强7500处理器,这样可以从双路扩展至8路,获得更大的内存容量。但特里没有对这种扩展的可能性进行表态。

Convey公司出产的第一台HC-1ex混合型超级计算机在今年9月已经低调运往Georgia Institute of Technology,但是现在才开始推向市场。Convey还和五家公司达成合作伙伴关系来推广他们的平台。Panasas公司目前是与混合多核超级计算机合作的网络互连存储合作伙伴。

Voci公司开发的语音识别软件是在Convey计算机上运行的,他们计划推出一款名为V-Blaze的HC-1和HC-1ex计算机应用软件应用工具版本,可以销售给那些想在他们自己的应用软件中增加语音识别和语音转换为文本功能的企业用户。Voci表示,V-Blaze应用工具可以对数百个电话会议进行转换并转化为文本。

[责任编辑:査彬]
Doserv原创 Vicky Z
纵观IT发展的历程,我们发现IT技术从最早的分布式结构走向了大集中的架构,而今,云计算的出现又将IT重新引向了分布式的老路。
官方微信
weixin
精彩专题更多
联想发布“腾云计划”正式进入云市场,同时推出ThinkServer Gen5,在众说纷“云”的云时代里联想推出云战略正当其时,服务器产品线的更新便是联想云时代里前行的新生力量。
2014年11月6号,HPC China 2014大会在广州长隆酒店正式召开。本次会议由中国计算机学会主板,中国计算机学会高性能计算专业委员会、中山大学和广东工业大学承办。
思科UCS:突破性能极限 重新定义平台
 

公司简介 | 媒体优势 | 广告服务 | 客户寄语 | DOIT历程 | 诚聘英才 | 联系我们 | 会员注册 | 订阅中心

Copyright © 2013 DOIT Media, All rights Reserved.