这只是个人思考的几个问题,不构成文章, 只是记录下来,供自己参考。因为没有实地看过天河的系统大结构,只是凭感觉,所以可能有错。
1。天河二号, 我参考的是TH-IVB-FEP型
目前广州中心的TH2配置是:共170个机柜,每个机柜4个框,每个框装16块主板。每个主板有两个计算节点。
由于一些框位用于交换机/备用电源/线组,还有4096个前端节点,所以,留下的空间给16,000个计算节点。
每个计算节点:用双路主板,装两颗Xeon E5 12core CPU,外加三个Xeon Phi 57核的GPU运算加速卡(俗称协处理器)。
16,000个计算节点就用了32,000颗Xeon E5 CPU和48,000个Xeon Phi协处理器,达到312万个计算核。
每个CPU配置16GB RAM,每个节点32G, 再加上每个Phi还有8GB。
每组计算节点(应该设置的四个一组),还有一个前端处理器,共有4096颗国防科大研发的FT1500,1.8ghz, 16核SPARC V9架构,40nm制程,功耗65瓦,峰值144GFLOPS。用于任务排程管理。
2。从时间看,机器是2013年底交付广州中心的,所以,Xeon E5 12core CPU,应该是Intel Ivy-Bridge的 E5-2692 V2 ,很新,一般够用。目前北美的新机所用的是更新的Haswell E5-26xx V3。而Intel马上要发布交付的是 Broadwell E5-2xxx V4。
广州中心申请升级的应该是什么,不清楚。美国商业部4月11日拒绝Intel对广州中心的升级申请,说的是什么,也不清楚。我猜想是Broadwell, 含不含Haswell 呢?
3。这个升级必要吗?
首先从价格看,从V2 到V3,Intel改变了Socket, 就是说要升级的话,其实就是所有的主板全换,成本之高,可以想见;
从V2 到V3,Intel原本都是从DDR3,改到了DDR4,虽说TH2的主板内接留有DDR3/DDR4口,但板面应当没有空间去实现,所以RAM也得换;
就是说, 除了交换机/线路/备用电源/制冷已外,全换,这种升级和新作一台,就差一个机框的价格。
再从功能看, 所谓比IBM的快,快在哪? 就是新了至少一代的CPU/GPU和交换口。
IBM出的早,用的类似Intel的V1 CPU,接口20GB/40G,还有GPU 是三年前的 Phi3,或 Kepler系列;
TH2出的晚,用的Intel较新的V2 CPU,接口20GB/40G,还有GPU 是一年前的 Phi5,(或 可以用Tesla系列);
从功效比看, HT2 的CPU/GPU都应该更省电,但爆出来的数据不理想,这一点我还没想到问题出在哪里。目前TH2的峰值为55PFLOPS(peta flops的缩写,每秒10的15次方次计算速度, 就是 每秒5.49亿亿次)。
即使前台的4096颗FT1500,性能也很好,也没有必要升级。
可见,从实际出发,目前升级无必要。除了争第一的价值,看不到其他意义。
4。天津飞腾的FT-1500A,和国科大的FT-1500的关系
总经理谷虹说FT-1500是64位通用CPU,兼容ARM V8指令集,28nm制程,包括4核和16核两款,目标在实现对Intel中高端“至强”服务器芯片的替代。
其中4核处理器 面向桌面终端和轻量级服务器,主频2GHz,功耗15W,两个DDR3-1600存储通道,支持电源关断、DVFS等低功耗技术,适用于构建台式终端、一体机、便携笔记本、微服务器等产品;
而16核处理器芯片面向服务器领域,主频2GHz,功耗35W,4个DDR3-1600存储通道,支持虚拟化功能,适用于构建网络前端接入服务器、事务处理服务器、邮件服务器、数据库服务器、存储服务器等产品。
5。苏州盛科网络的“智桥”SDN智能高密度万兆交换芯片CTC8096
总经理“千人计划”专家孙剑勇介绍,是其自主研发的第四代交换芯片,目标是快速响应云计算、大数据、网络功能虚拟化的市场趋势,芯片具有性能优、功能强、功耗低和高可靠、高性价比等特点。该芯片由9.4亿人晶体管构成,具有1.2T的交换容量;配图了96个10G端口,24个40G端口,4个100G端口,支持L2/L3/MPLS/OpenFlow和数据中心功能等特性集合。
这些指标不错,未来几年都够用。
6。目前应用开发比升级更重要。中国超级计算应当下的大功夫,除了计算芯片,就是应用开发,都是耗费时日的工作。有时候还出力不讨好。按论文行赏/职称的概念要改变,否则没有献身的。精神和经济都重要。
目前的TH2只要用好了, 可以再“领先”两年,因为没人喜欢去用几万个CPU/GPU作个大物件放那当摆设。
7。国科大的任务是国防科技,中国应当把民用的发展放在曙光/浪潮,就名正言顺了。当然地方的不买帐事要处理。
8。还有一个描述: 各运算阵列中,每块主板上分为APU和CPM两块,APU部分支撑5个Xeon Phi,CPM支撑1个Xeon Phi 和4颗Xeon E5。
APU和CPM之间以CPU內部提供的PCI-E 3.0 16x介面连接,但实际由于Xeon Phi的限制,仅支援PCI-E 2.0 16x,所以每个通道的数据传输为10Gbps。
这就说明TH2目前的GPU可以单独升级,做到3.0级接口。每个约$3000以上,可以对付48,000个。
9。从目前Intel Xeon的性能看,TH2从55到100PFLOPS的升级,应该是可以做到的。只要美国政府容许Intel 放行。
Broadwell(还没有发布具体指标),
Haswell E5-2699-V3, 18core, 2.3ghz,45MB,22nm
对比现在用的E5-2692-V2, 12core, 2.2ghz,30MB,22nm
10。美国政府不放行,Intel希望交货,Intel的股东也希望交货, 那可是几个亿的买卖。但国家和公司两者矛盾。