我国自主研发“天河三号”E级原型机完成研制部署
近日从位于天津滨海新区旗下开发区的国家超级计算天津中心传来消息,我国自主研发的新一代百亿亿次超级计算机——“天河三号”E级原型机完成研制部署,并顺利通过分项验收。该原型机系统采用了三种国产自主高性能计算和通信芯片。在此基础上,“天河三号”超级计算机预计于2020年研制成功。
“超级计算机已成为一个国家信息技术创新的核心驱动,国家综合国力提升的强大支撑,以及快速发展高端信息技术的牛鼻子。”国家超级计算天津中心主任刘光明表示。
百亿亿次超级计算机也就是E级超级计算机。当前,新一代百亿亿次超级计算机的研制计划是国际上高端信息技术创新和竞争的制高点。美国和日本均已提出E级超级计算机的研制计划,拟在2020年或之后完成研制。
我国超算问鼎世界桂冠是从部署在国家超级计算天津中心的“天河一号”起步。一路走来,先后有“天河二号”和“神威·太湖之光”等传承和发展。面对超算发展新趋势,2016年,科技部结合“十三五”发展规划,通过国家重点研发计划支持,开始分两期启动我国E级计算机研制计划。第一期主要为“E级计算机关键技术”研究,安排了三个E级原型样机的研制,第二期为具体研制E级计算机。
国防科技大学和国家超级计算天津中心等团队合作承担了“天河三号E级原型机系统”研制项目。经过两年多的持续关键技术攻关和突破,原型系统研制成功,并在国家超级计算天津中心部署完成,7月22日顺利通过科技部高技术中心组织的分项课题验收,随后将逐步进入开放应用阶段。
相比上一代超级计算机,“天河三号”是一个划时代的先进技术作品。它实现了丰富的技术创新,这在原型机上已经得到淋漓尽致的体现。
“几十年的积累和不断的技术创新,在‘天河’超级计算机核心关键技术上实现了整体自主可控。”刘光明说,在“天河三号E级原型机系统”项目实施中,团队自主设计了三款芯片:“迈创”众核处理器(Matrix-2000+),高速互连控制器,互连接口控制器;设计了四类计算、存储和服务结点,十余种印制电路板;设计和实现了新型的计算处理、高速互连、并行存储、服务处理、监控诊断、基础架构等硬件分系统,以及系统操作、并行开发、应用支撑和综合管理等软件分系统。
依托于全面技术创新,“天河三号E级原型机系统”实现了可适应科学计算和数据处理多应用需求的柔性体系结构,突破了计算访存通信三方平衡的高性能计算结点技术,可支持十万结点规模的高速互连和光电混合高速信号传输技术,高效靶向散热冷却技术,用户透明的高性能计算环境软件支撑等技术。
在原型机上关键技术的突破,支撑了“天河三号”百亿亿次整机系统研制全面计算、访存、通信性能平衡的设计方案。未来,“天河三号”将对已经设计生产的计算、互连通信核心芯片再进行全面升级,进一步完善可支持艾字节(EB)级海量数据存储的层次式存储系统,优化适用高性能计算和高效大数据处理的柔性体系结构。利用2到3年的时间,预计在2020年左右,打造出全自主的具有国际领先水平的新一代“天河三号”E级超级计算机。届时,其运算能力将比“天河一号”提高200倍,实现质的飞跃。
在刘光明看来,性能卓越的国产新一代超算“既好看又中用”。它将有助于解决我国高性能计算能力问题,为解决我国国民经济和科学研究等领域的挑战性问题提供不可替代的重要技术手段。同时可直接提高科研院所的科技创新能力,提升企业核心竞争力。
“国家超级计算天津中心是国际上首个依靠高技术服务实现收支平衡的超算中心。”国家超级计算天津中心应用研发部部长孟祥飞介绍,中心使用的“天河一号”已经是世界上获得最广泛应用的超级计算机,每天运行的计算任务超过1400个,用户涵盖油气勘探、高端装备制造、药物研发、雾霾预警预报等领域的重点科研、企业、政府机构近1600家。
“天河一号”累计支持国家科技重大专项、国家重点研发计划等重大项目超过1300项,涉及经费超过20亿元,取得国家级、省部级等重要奖励成果及出版成果超过2000项。通过先进产品设计、先进工艺优化、先进材料研发等,为企业年均新增经济效益超过30亿元。
孟祥飞说,未来,国家超级计算天津中心将依托“天河三号”,构建超级计算与云计算、大数据和人工智能深度融合的高性能计算服务平台,将在长效高分辨率气候气象预报、大规模航空航天数值风洞、地震地质研究和油气能源勘探、脑科学与基因工程等一系列超大规模计算与模拟,以及涉及国计民生、信息安全的政务数据、医疗卫生、基因健康等大数据分析处理领域,发挥支撑和平台作用。
该中心还将进一步引领天津智能产业创新发展,以“京津冀大数据协同处理中心”等为载体,对接雄安新区,全面服务京津冀协同创新,成为京津冀区域创新发展的重要引擎。