北航网络信息中心有两组高性能计算集群,分别命名为星空(Think)高性能计算集群一和星空高性能计算集群二。星空高性能计算集群一作为科学和工程计算用途,用于正式的科学研究计算;星空高性能计算集群二作为学习测试用途,用于集群环境管理测试以及高性能学习。星空高性能计算集群二除了集群规模比星空高性能计算集群一小之外,两者结构一致。星空高性能计算集群二的介绍和使用文档除了参考星空高性能计算集群一的文档之外,详见PPT《北航集群2简明使用手册》;下文详细介绍星空高性能计算集群一,以下简称星空高性能计算集群。
星空高性能计算集群由64个刀片服务器、4台机架式服务器组成,其中刀片服务器作为计算节点,机架服务器作为管理节点和IO节点。每台刀片服务器的配置为2颗Intel Xeon E5530(2.4GHz)处理器和24GB(12×2GB) DDR3 1066GHz内存,总计算能力一共有512核处理器,再打开超线程后,一共有1024核处理器。计算网络采用40Gb的高带宽、低延迟的Infiniband网络,计算节点与IO节点之间也通过IPoIB网络连接,保证读写密集型程序的高带宽和低延迟需求。管理网络通过机箱背板上的交换机模块和千兆以太网交换机互联,所有计算节点、管理节点、IO节点都采用千兆以太网互联。集群拓扑结构参见下图:

集群节点操作系统为Red Hat Enterprise Linux Server release 5.4 x86_64,集群管理软件为开源Rocks管理软件,并装有 C、C++、Fortran 编译器和支持以太网及Infiniband 高速网络的MPI并行环境(包括Open MPI 1.4.1和MVAPICH 1.2.0),还装有ANSYS 流体动力学软件。IO系统通过光纤存储网络连接磁盘阵列,IO节点安装Lustre(版本1.8.3)并行文件系统,由一个MDS和三个OST组成(其中一个IO节点既是MDS又是OST),总存储能力5.1T。
本集群理论峰值为4902.912 Gflops,经过Linpack测试,实测峰值为4344Gflops,效率为88.60%。