英特尔金君:MIC众核原型来自于奔腾

DOSERV原创 崔昊 发表于:10年07月19日 10:00 [原创] 服务器在线

  • 分享:
[导读]在演讲中,金君提到,英特尔新推出的Knights Ferry众核架构产品将是至强平台的补充,已经作为协处理器提供给用户,虽然其在部分应用上的性能提升十分显著,但应该充分认识到,众核架构只是适合少数应用,如矩阵乘法、FFT等计算模型。

DOIT原创报道: 在7月16日开幕的中国教育科研网格(ChinaGrid)第五届学术年会上,英特尔公司的工程师金君向与会用户做了题为《以应用为导向的平台搭建、性能优化和技术推进》的演讲,在演讲中,金君提到,英特尔新推出的Knights Ferry众核架构产品将是至强平台的补充,已经作为协处理器提供给用户,虽然其在部分应用上的性能提升十分显著,但应该充分认识到,众核架构只是适合少数应用,如矩阵乘法、FFT等计算模型。

金君详细的介绍了Knights Ferry的情况,据他介绍,Knights Ferry拥有独立的二级缓存,它们之间通过环形链路做到缓存一致性,每一个核心支持3个线程,目前的产品拥有32个核心。英特尔为Knights Ferry增加了向量指令的支持,其最高支持512位的向量指令,一条指令包括16个单精度浮点计算,而Knights Ferry在一个周期内能够运行一条指令。

令人惊奇的是,金君表示,Knights Ferry除了部分出自此前调整的Larabee项目的研究成果,其产品原型实际上来自于奔腾产品。

据金君介绍,Knights Ferry的编程方法包括进程级的并行编程方法以及本身的并行编程方法,且支持不同的线程、OepnMP,并支持128个线程,而第三种编程方法被称之为Vector Paralle,但金君同时提到,编译性能实际上取决于向量化的工作是否完成的足够好。

“做向量化的工作可以采用直接用汇编指令的方式,或者是直接用编译器定义的方法,此外,还可以采用编译器自动向量器进行编译向量化的工作。”但金君同时也表示,做向量化要看系统的处理器、内存、QPI速度等不同的选择组合,用户应当做好充分的应用分析,并了解应用的特征。

而针对应用程序优化这一火热的话题,金君也给出了自己的建议,他建议,用户应当首先做系统本身的性能分析,然后再改善算法应用程序、数据结构或进行线程优化。此外,基于微架构的调整、数据访问效率、缓存利用率以及向量化调整做的是否到位,都将是影响一台HPC未来性能的原因。

[责任编辑:崔昊]
Niky
SPARC T5与SPARC M5处理器及其相应计算系统的上市,也标志着这一重要的产品家族对客户的承诺得到了相应的保证。
官方微信
weixin
精彩专题更多
联想发布“腾云计划”正式进入云市场,同时推出ThinkServer Gen5,在众说纷“云”的云时代里联想推出云战略正当其时,服务器产品线的更新便是联想云时代里前行的新生力量。
2014年11月6号,HPC China 2014大会在广州长隆酒店正式召开。本次会议由中国计算机学会主板,中国计算机学会高性能计算专业委员会、中山大学和广东工业大学承办。
思科UCS:突破性能极限 重新定义平台
 

公司简介 | 媒体优势 | 广告服务 | 客户寄语 | DOIT历程 | 诚聘英才 | 联系我们 | 会员注册 | 订阅中心

Copyright © 2013 DOIT Media, All rights Reserved.