对Intel Xeon --〉美国商业部 --〉中国超级计算的初步看法

杨子 · 2015-04-21 00:36:27Z

对Intel Xeon --〉美国商业部 --〉中国超级计算的初步看法简介

来源: 杨子于 2015-04-21 00:36:27 [档案] [博客] [旧帖] [给我悄悄话] 阅读数 : (6292 bytes)

本帖于 2015-04-21 07:47:36 时间, 由普通用户杨子编辑

这只是个人思考的几个问题，不构成文章，只是记录下来，供自己参考。因为没有实地看过天河的系统大结构，只是凭感觉，所以可能有错。

1。天河二号，我参考的是TH-IVB-FEP型

目前广州中心的TH2配置是：共170个机柜，每个机柜4个框，每个框装16块主板。每个主板有两个计算节点。
由于一些框位用于交换机/备用电源/线组，还有4096个前端节点，所以，留下的空间给16,000个计算节点。

每个计算节点：用双路主板，装两颗Xeon E5 12core CPU，外加三个Xeon Phi 57核的GPU运算加速卡（俗称协处理器）。

16,000个计算节点就用了32,000颗Xeon E5 CPU和48,000个Xeon Phi协处理器，达到312万个计算核。
每个CPU配置16GB RAM，每个节点32G，再加上每个Phi还有8GB。

每组计算节点（应该设置的四个一组），还有一个前端处理器，共有4096颗国防科大研发的FT1500，1.8ghz， 16核SPARC V9架构，40nm制程，功耗65瓦，峰值144GFLOPS。用于任务排程管理。

2。从时间看，机器是2013年底交付广州中心的，所以，Xeon E5 12core CPU，应该是Intel Ivy-Bridge的 E5-2692 V2 ，很新，一般够用。目前北美的新机所用的是更新的Haswell E5-26xx V3。而Intel马上要发布交付的是 Broadwell E5-2xxx V4。

广州中心申请升级的应该是什么，不清楚。美国商业部4月11日拒绝Intel对广州中心的升级申请，说的是什么，也不清楚。我猜想是Broadwell，含不含Haswell 呢？

3。这个升级必要吗？

首先从价格看，从V2 到V3，Intel改变了Socket，就是说要升级的话，其实就是所有的主板全换，成本之高，可以想见；
从V2 到V3，Intel原本都是从DDR3，改到了DDR4，虽说TH2的主板内接留有DDR3/DDR4口，但板面应当没有空间去实现，所以RAM也得换；
就是说，除了交换机/线路/备用电源/制冷已外，全换，这种升级和新作一台，就差一个机框的价格。

再从功能看，所谓比IBM的快，快在哪？就是新了至少一代的CPU/GPU和交换口。
IBM出的早，用的类似Intel的V1 CPU,接口20GB/40G，还有GPU 是三年前的 Phi3，或 Kepler系列；
TH2出的晚，用的Intel较新的V2 CPU,接口20GB/40G，还有GPU 是一年前的 Phi5，（或可以用Tesla系列）；

从功效比看， HT2 的CPU/GPU都应该更省电，但爆出来的数据不理想，这一点我还没想到问题出在哪里。目前TH2的峰值为55PFLOPS（peta flops的缩写，每秒10的15次方次计算速度，就是每秒5.49亿亿次）。

即使前台的4096颗FT1500，性能也很好，也没有必要升级。

可见，从实际出发，目前升级无必要。除了争第一的价值，看不到其他意义。

4。天津飞腾的FT-1500A，和国科大的FT-1500的关系

总经理谷虹说FT-1500是64位通用CPU，兼容ARM V8指令集，28nm制程，包括4核和16核两款，目标在实现对Intel中高端“至强”服务器芯片的替代。

其中4核处理器面向桌面终端和轻量级服务器，主频2GHz,功耗15W，两个DDR3-1600存储通道，支持电源关断、DVFS等低功耗技术，适用于构建台式终端、一体机、便携笔记本、微服务器等产品；
而16核处理器芯片面向服务器领域，主频2GHz，功耗35W，4个DDR3-1600存储通道，支持虚拟化功能，适用于构建网络前端接入服务器、事务处理服务器、邮件服务器、数据库服务器、存储服务器等产品。

5。苏州盛科网络的“智桥”SDN智能高密度万兆交换芯片CTC8096

总经理“千人计划”专家孙剑勇介绍，是其自主研发的第四代交换芯片，目标是快速响应云计算、大数据、网络功能虚拟化的市场趋势，芯片具有性能优、功能强、功耗低和高可靠、高性价比等特点。该芯片由9.4亿人晶体管构成，具有1.2T的交换容量；配图了96个10G端口，24个40G端口，4个100G端口，支持L2/L3/MPLS/OpenFlow和数据中心功能等特性集合。

这些指标不错，未来几年都够用。

6。目前应用开发比升级更重要。中国超级计算应当下的大功夫，除了计算芯片，就是应用开发，都是耗费时日的工作。有时候还出力不讨好。按论文行赏/职称的概念要改变，否则没有献身的。精神和经济都重要。

目前的TH2只要用好了，可以再“领先”两年，因为没人喜欢去用几万个CPU/GPU作个大物件放那当摆设。

7。国科大的任务是国防科技，中国应当把民用的发展放在曙光/浪潮，就名正言顺了。当然地方的不买帐事要处理。

8。还有一个描述：各运算阵列中，每块主板上分为APU和CPM两块，APU部分支撑5个Xeon Phi，CPM支撑1个Xeon Phi 和4颗Xeon E5。
APU和CPM之间以CPU內部提供的PCI-E 3.0 16x介面连接，但实际由于Xeon Phi的限制，仅支援PCI-E 2.0 16x，所以每个通道的数据传输为10Gbps。

这就说明TH2目前的GPU可以单独升级，做到3.0级接口。每个约$3000以上，可以对付48,000个。

9。从目前Intel Xeon的性能看，TH2从55到100PFLOPS的升级，应该是可以做到的。只要美国政府容许Intel 放行。

Broadwell（还没有发布具体指标），
Haswell E5-2699-V3， 18core， 2.3ghz，45MB，22nm
对比现在用的E5-2692-V2， 12core， 2.2ghz，30MB，22nm

10。美国政府不放行，Intel希望交货，Intel的股东也希望交货，那可是几个亿的买卖。但国家和公司两者矛盾。

您的位置：文学城 » 论坛 » 时事述评 » 对Intel Xeon --〉美国商业部 --〉中国超级计算的初步看法

所有跟帖：

• 目前中国对超算依赖不大 -笨狼- ♂ (120 bytes) () 04/21/2015 postreply 06:59:45

• 建的那么多超算中心，使用率不高。不过是练手的好场地，会促进国家高档设备的研发与跟进。 -杨子- ♂ (0 bytes) () 04/21/2015 postreply 08:02:05

请您先登陆，再发跟帖！

对Intel Xeon --〉美国商业部 --〉 中国超级计算的初步看法

所有跟帖：

对Intel Xeon --〉美国商业部 --〉中国超级计算的初步看法