返回列表 发帖

扒一扒中国超算榜单里的“黑马”

Linpack测试性能达3.743PFlops,峰值性能达7.035PFlops。
  
  在近日公布的2020中国高性能计算机性能排行榜Top 100中,北京超级云计算中心无疑是最令人瞩目的那一个。
  
  这是因为榜单的前2位已经五年没有发生更迭,还是熟悉的两个——“神威太湖之光”和“天河二号A”,而榜单的第3位,也就是北京超级云计算中心,则是异军突起的新面孔。
  
  今天,我们就来深扒北京超级云计算中心背后的故事。
  
  “王谢堂前燕
  
  飞入寻常百姓家”
  
  在大家的印象里,超算往往都是大家伙、重武器,是用于研究核能聚变、宇宙、气候等国家级课题的“国之重器”。其实,在“国民经济主战场”,更多的应用是无法企及国之重器这样的高度的,这就要求超算不能只是“王谢堂前燕”,还要“飞入寻常百姓家”。
  
  简单来说,目前超算行业正在形成三类市场:
  
  第一类,尖端超算,需要国家集中力量办大事,打造最尖端的超算中心;
  
  第二类,通用超算,需要性价比高的解决方案,超级云计算中心的模式对推动超算商业化具有重大的作用;
  
  第三类,行业超算,需要根据业务需求设计上云流程,提供行业定制。
  
  而北京超级云计算中心(A分区),就属于不折不扣的、服务千行百业的通用超算。通过“云化”的超算服务模式,服务于对算力不同需求的科研用户,同时也为国家超算提供给了重要的算力补充。
  
  据了解,北京超级云计算中心成立于2011年,依托中国科学院计算机网络信息中心建立,由北京北龙超级云计算有限责任公司负责运营,是怀柔科学城北京市人民政府与中国科学院共同建设的重点项目。本次夺得第3名的北京超级云计算中心A分区,是中心现有资源池的一部分。为满足不同用户对计算的使用和资源存储需求,中心还有T分区、M分区、IO分区以及科技云9分区等。
  
  
  
  成立9年的超算中心
  
  冲击超算榜单靠的是什么?
  
  榜单发布人、中国科学院计算技术研究所研究员张云泉介绍,2020年共计提交73台新系统,根据TOP100排行规则,排重合并后新增机器上榜47台,这也意味着,2019年榜单中的100台系统仅剩余53台,淘汰率接近50%,竞争程度之激烈可见一斑。
  
  那么,一家成立9年的超算中心,靠的什么一举斩获2020中国HPC榜单第三呢?
  
  显然,这和技术的升级迭代脱离不了关系。
  
  2019年8月,AMD发布了全球首颗7nm制程工艺,代号为“罗马”的第二代AMD EPYC霄龙系列处理器。在架构方面,新一代AMD Infinity架构突破了x86性能和计算能力,获得了同类产品最高的I/O和内存带宽,在多种工作负载下最高能够将总体拥有成本(TCO) 降低50%。
  
  
  
  而北京超级云计算中心正是敏锐地把握住了技术创新的趋势。3个月后的同年11月,北京超级云计算中心选择戴尔科技为设备供应方,采用第二代AMD EPYC 处理器的A分区迅速正式上线了100个节点,截至2020年10月已逐步扩容到3000节点,从而实现算力的大跨越。
  
  迎来黄金期的超算
  
  戴尔科技助力前行
  
  近年来,随着国内移动互联网快速发展,越来越多企业对强大算力的需求持续升温,这也给中国超算的发展带来了黄金期。
  
  统计数据显示,截至2019年,我国传统超算市场的整体规模达280亿元,其中尖端超算目前大约占四分之一,而通用超算占四分之三。但目前来看,超算主要是尖端超级计算机及其用户,中小用户和面向行业的业务型用户的需求没有得到满足。
  
  北京超级云计算中心聚焦通用计算市场,以随需供应的“超级云计算服务”的模式向用户提供算力,面向海量无超算资源的用户以及中小微超算用户,无疑为超算的商业化发展探索出一条新路线。
  
  还需指出的是,“计算”作为一种支撑和工具,它只是先进生产力链条中的一个环节。在计算之外,数据的采集与处理、软件的设计与调优、模型模式的开发等等,同样重要。
  
  在这方面,戴尔科技作为全球领先的IT端到端解决方案提供商,不仅为像北京超级云计算中心这样的客户提供全面的HPC就绪方案和HPC产品方案,同时也在软件应用等方面,帮助客户用好超算,释放超算的更大潜力。
  
  坐落于著名学府剑桥大学的“Cumulus–英国科学云”是英国最大的学术超级计算机,由戴尔科技为其提供算力支持,性能可达每秒超过2千万亿次浮点运算。
  
  除了算力支持外,戴尔科技还联合合作伙伴开发了戴尔数据加速器(Dell Data Accelerator:DAC),通过基于NVMe的存储解决方案,消除了拖慢系统性能的存储瓶颈,实现了HPC系统中新一代的数据密集型工作流程。
  
  
  
  在2019年6月Virtual Institute公布的2019 I/O-500榜单中,集成了DAC的Cumulus以620.69的得分位列第一,领先第二名290分!这意味着它首次亮相即是世界上最快的HPC存储系统,比第二名的性能提高了近一倍。
  
  并且,戴尔科技通过经工程验证的系统配置(包括DAC服务器节点,内存,网络,PCIe存储和NVMe存储),已向广大HPC用户提供该解决方案,从而共享DAC的优势。这意味着DAC提供了全球最快的开源NVMe存储解决方案之一。
  
  可以看见,戴尔科技能为HPC用户提供的,绝不仅仅是算力这么简单。事实上,凭借多年的创新与开放,戴尔科技已经形成了完整的生态系统,可以为客户提供从HPC的采购到部署、从应用到运维的全生命周期管理服务,释放超算的强大潜力,让客户将精力真正投入到业务当中。

返回列表