互联网+ 电子商务 智能家居 地理信息 高端装备 信息安全 3D打印 工业4.0 人工智能 光伏 新能源汽车 消费品 集成电路 移动支付 汽车 数据中心
2018国际先进制造业集群发展论坛
当前位置:首页 > 产业观察 > 信息化 > 电子信息 > 正文

解析中国本土企业并行加速器领域发展现状

发布时间: 2014-08-27 10:51   作者: 刘新   来源: 赛迪顾问

  在并行加速器领域,目前,国内的服务器厂商如浪潮、曙光、联想和宝德,正在积极展开与并行加速器厂商Nvidia、AMD、Intel合作,其中,浪潮、曙光在并行加速器领域较为活跃,不仅缘于这两大国内服务器厂商在高性能计算领域的业务发展需要,更重要的是他们也较其他国内品牌厂商能更敏锐地觉察并行加速器应用市场广阔的发展前景。

  一、浪潮

  1、发展战略

  (1)设立专门的行业软件移植开发团队,完善自主的高性能应用产品线

  作为国内领先的HPC应用创新领导厂商,浪潮一直在思考如何将计算能力与实际应用相结合、将计算能力转化为用户的应用价值。为此,浪潮提出HPC系统不仅要“好用”,更要“用好”的研发理念,不仅建立了高性能专业应用研究与开发团队,同时还不断完善高性能应用创新体系,完善自主的高性能应用产品线。尤其是通过仔细研究HPC行业的发展趋势,成为国内最早布局基于CPU-GPU的HPC异构架构的IT厂商,并设立专门的行业软件移植开发团队,专业研究GPU技术、MIC技术等最新的并行计算技术,关注其生态环境建设,并将这些先进技术引入HPC行业用户,通过与客户强强合作联合开发,多年来,在GPU应用方面和行业客户打成一片,积累了丰富的行业应用经验,形成了独特的异构HPC行业软件开发的方法论。

  (2)打破传统高性能集群思路,开拓高性能计算应用新路径

  在并行加速器应用领域,早在2009年浪潮就与NVIDIA展开战略合作,打破了原有的高性能集群思路,推出业界首款万亿次桌面超级计算机——“倚天”。浪潮“倚天”采用“CPU+GPU”协同计算加速架构,实现了在单台计算机上性能的倍速提升,成本的大幅度下降,有效解决了用户在传统高性能集群应用时所面临的成本、体积、功耗、部署等一系列问题,不仅大幅提升国家科研竞争力的水平,同时也为我国高性能计算的普及开拓了新的路径。目前,“CPU+GPU”并行加速器应用逐步成为超级计算机的流行系统架构,曾取得全球TOP500第一的天河1A千万亿次超级计算机就是采用的“CPU+GPU”异构计算架构。而利用NVIDIA CUDA并行计算技术发挥超级计算机的应用性能已成为超级计算机及应用技术的新趋势、新潮流,越来越多的科研、高校、石油、生命科学、动漫等用户采用这一技术提高运算效率和计算性能。

  当然,浪潮在并行加速领域应用合作并没有止于NVIDIA的合作,随着Intel集成众核MIC架构不断成熟,浪潮在高性能计算产品线中也相继引入基于Intel MIC并行加速应用,在2011年8月浪潮与Intel合作建立了“浪潮-英特尔中国并行计算联合实验室”,主要致力于MIC技术的研究,并在MIC平台上开展实际的高性能计算应用项目的工作,旨在推动中国“百亿亿次”超算系统架构与应用创新,使计算芯片从多核向众核过渡,体系结构由单一架构走向混合架构,同时,底层技术的改变也带动了算法设计、编程模型及工具链甚至客户应用模式的整体变革,不仅为Intel至强融核产品的顺利面世做出了很大贡献,也为至强融核产品的普及做出了很大的努力。

  (3)加强与上游厂商战略合作,推动并行加速器应用人才培养

  虽然CPU+GPU并行加速器应用已逐步成为主流的计算技术,但在中国,GPU发展面临着“应用脱节、人才跟不上”等现实问题。当前,并行加速器的广泛应用还要依赖于并行算法、编程效率和系统扩展性以及系统利用率等技术,但目前专业GPU应用开发人才还存在着较大的需求瓶颈,浪潮意识到“要想在应用上取得突破,只有GPU领域有了充足的人才,GPU并行计算才能得以快速的发展。”因此,2012年起,浪潮相继与NVIDIA、Intel两家上游厂商展开人才培养计划,进一步推动中国并行加速器应用的发展。2012年9月,与NVIDIA联合发布“GPU卓越人才计划”,主要包含了六大方面:

  · 建立高性能计算社区,为GPU计算提供广阔交流平台。

  · 设置基于GPU计算的行业应用整体解决方案开发团队,进行基于GPU应用的行业整体解决方案开发、验证和推广。

  · 有效地市场活动来推进GPU应用技术的认知。

  · 出版相关技术专着,普及GPU计算知识。

  · 扶植GPU应用典型案例,如算法级应用、桌面级应用、工业集群应用等,确实推进GPU发展。

  · 大力推进“卓越人才认证培训计划”,打造中国ICCE技术应用工程师认证第一品牌;培养更多的GPU应用人才。

  同样,“中国IMCE应用技术工程师认证培训”也是浪潮与Intel在并行计算领域合作的结晶,旨在满足所有对MIC众核技术、MIC应用开发与编程有需求的在校学生、编程人员等,提升他们在MIC众核技术及应用动手能力。主要内容包括MIC软硬件架构、软件编程、系统与算法优化、调试与调优工具的使用、HPC应用开发过程、应用优化案例等,除应用专家现场精讲外,培训还提供MIC远程体验平台,让学员有机会亲身体验新技术、新设备,便于理论学习与实际操作相结合。

  2、应用案例

  浪潮多年来致力于高性能计算的应用创新发展,不仅参与过中国第一台全自主千万亿次超级计算机“神威蓝光”的研制、还参与超级计算机天河1A、天河二号的研制,与很多国内外客户建立了长期友好的合作关系,特别是近年来并行加速器应用的快速发展,浪潮基于“CPU+GPU”和”CPU+MIC“等并行加速器应用案例也层出不穷。

  (1)瞄准个人HPC的万亿次桌面机

  浪潮这款桌面超级计算机采用的是CPU+GPU混和架构,计算单元用的是英特尔Nahalem处理器核心和NVIDIA的GPU。相当于普通PC服务器的体积上提供了万亿次的计算性能,为大量数据并行处理、计算密集型应用提供了一种全新的超高性价比的解决方案,为广大科学工作者提供了绿色、环保的个人超级计算机。

  (2)中国对地观测科研工程

  这是浪潮特别为中国科学院对地观测中心量身定制的基于“GPU+CPU”混合架构的高性能天梭TS10000集群系统解决方案。其中CPU计算能力近3万亿次;CPU+GPU部分由浪潮倚天GPU服务器组成,计算能力高达20万亿次。

  (3)上海交大超级计算机

  是浪潮为上海交通大学构建的百万亿次超级计算机,现在是中国高校领域最快的超级计算机。该系统采用CPU+GPU+MIC的架构设计,计算性能达到263万亿次,计算性能超过上海超级计算机中心的“魔方”(200万亿次),也因此成为上海地区最快超算系统。

  二、曙光

  1、发展战略

  (1)通过精细化产品定位,形成了覆盖较全面的GPU产品线

  作为国内领先的HPC厂商,曙光始终倡导“自主创新服务中国”的理念,以全面、专业、增值的服务为用户提供良好的应用体验。面对并行加速器技术在高性能计算领域的应用趋势,曙光将GPU服务器作为高性能计算创新的一个方向。2012年12月,曙光携手业界领先的GPU厂商NVIDIA,为国内用户提供更高的计算能力,展开在设计、研发、技术合作、市场开拓等方面深度合作,不仅大力研发GPU系列产品,也对NVIDIA的GPU系列产品做了明确定位,如,将Tesla K20X、Tesla K20、Tesla M2090和Tesla M2075定位为地震处理、计算流体力学、计算机辅助工程、金融计算、计算化学与物理学、数据分析、卫星成像、天气建模等应用,将Tesla K10定位为地震处理、信号与图像处理、视频分析等应用。为此,2012年12月,曙光携手NVIDIA发布三款GPU服务器,分别为TC4600 GPU刀片服务器、天阔W5801-G10机塔互换式服务器和天阔I620-G15机架式服务器,曙光亦由此形成了较为全面的GPU产品线,涵盖刀片式、机架式、塔式等多种服务器类型,通过产品的细分化定位来满足行业用户对高性能计算提出的多种需求。除了GPU服务器产品外,曙光还能为用户提供GPU集群管理软件Gridview,并且还向用户提供GPU应用移植、调优及GPU集群支持维护等全方位的服务。

  (2)不定期主办技术研讨会,积极推进GPU并行加速器应用落地

  除产品层面的研发合作外,曙光还与NVIDIA不定期地联合主办的“GPU并行计算应用研讨会”,邀请来自如中科院过程所、中科院网络中心、青海大学、甘肃省计算中心等多家单位的科研工作者参加会议,通过会议研讨的形式不仅能让科研人员对GPU并行计算在未来科研领域中的重要性有深刻的认识,同时还可以促进不同学科科研人员在并行计算领域的合作交流,建立初步的合作机制,对GPU并行计算的应用和推广起到了积极的作用。

  (3)借助GPU产品独有优势与解决方案创新力,决胜云计算

  近年来,曙光开始了从硬件设备制造商向信息技术服务商转型之路,努力成为国内云计算技术、产品、解决方案及服务的核心供应商。曙光凭借多年自主可控的技术优势,以及对GPU并行加速应用的研发创新,开始为用户提供一揽子的HPC GPU解决方案,切实解决用户实际问题。同时,曙光还将GPU应用技术引入云计算领域,通过GPU虚拟化技术为三维远程可视化领域开辟出一个新天地,形成GPU的“桌面云”概念。

  2、应用案例

  (1)曙光助力华东理工大学CPU+GPU混合架构平台

  系统主要用于华东理工大学材料设计、催化剂设计、药物设计、计算生物学、流体与固体力学计算等领域的科学研究,促进相关学科科研的发展,因此对成熟稳定、高可靠、高性能的系统平台方案有着巨大需求。本系统采用曙光高效能计算机架构来构建,应用CPU+GPU的混合架构,由7个机柜组成,用来安装GPU专用机和曙光A840r-H计算节点,管理、登录、I/O节点、高速交换机、存储等设备。

  方案的最大特点是采用了GPU专用机。GPU专用机兼容主流的的32位及64位应用,并针对CAD、仿真模拟、动画制作以及CG渲染等应用进行了优化,它能解决具有极高的计算密度的数据并行计算问题。

  (2)曙光GPU集群管理全面护航中山大学

  系统的构建主要遵从中山大学生命科学领域的进化基因组学与基因功能分析整合及应用、地理科学领域的基于网格计算的地理模拟、环境科学领域的城市群空气质量数值预报和应急救援污染扩散预警、生物化学领域的QM/MM-FEP研究亚铁螯合酶催化机制、信息科学领域的云计算-桌面虚拟化等实际需求。为此,曙光针对稠密、稀疏线性方程作GPU并行化测试,最终决定选用NVIDIA Tesla C2050 GPU。集群GPU计算节点共配置200余块NVIDIATesla C2050 GPU卡,共提供118.15Tflops计算能力。同时,针对用户应用管理需求,曙光配置了自主研发的高性能计算平台管理软件Gridview以支持GPU计算监控,帮助用户随时了解GPU软硬件信息,如GPU的型号、软件版本、主频、风扇转速和温度变化等。

收藏