當前位置:
首頁 > 最新 > 全球高性能計算髮展態勢分析

全球高性能計算髮展態勢分析

歡迎引用

鄭曉歡,陳明奇,唐川,張娟,房俊民. 全球高性能計算髮展態勢分析[J].世界科技研究與發展, doi:10.16507/j.issn.1006-6055.2018.06.001.

鄭曉歡,陳明奇(中國科學院辦公廳)

唐川,張娟,房俊民(中國科學院成都文獻情報中心)

摘要:高性能計算對現代社會的科學研究、社會服務、經濟活動而言,已成為不可或缺的戰略工具,全球眾多國家都極為重視高性能計算能力的建設與發展。尤其是隨著超級計算機的速度日益提升,以及摩爾定律即將失效的現實,主要國家和地區都將重心放到研發下一代高性能計算機和超級計算機上,引發了新一輪圍繞高性能計算機的競爭。本文回顧了近年來美、歐、日等主要國家和地區在高性能計算方面的戰略規劃與項目部署,分析了現階段高性能計算髮展的挑戰與相關發展趨勢,最後討論了我國高性能計算的研製與應用進展,以及可進一步提升的空間。

關鍵詞:高性能計算;戰略;趨勢;應用

doi:10.16507/j.issn.1006-6055.2018.06.001

1 引言

高性能計算(High Performance Computing,HPC)是利用並行處理和互聯技術將多個計算節點連接起來,從而高效、可靠、快速地運行高級應用程序的過程,在許多情況下又被稱作超級計算(Supercomputing),可以提供比普通台式計算機或工作站更高的性能,以解決科學、工程或商業中的複雜問題,已成為解決科學研究、經濟發展、國家安全等方面諸多重大難題的重要手段。發展高性能計算催生了許多高端技術,並推動了下游產業的發展,因此各發達國家多年來均投入大量資金和人力發展高性能計算。

目前,我國已建成由17個高性能計算中心構成的國家高性能計算服務環境,資源能力位居世界前列,尖端成果不斷湧現。我國研製的超級計算機已連續10次在以Linpack性能排名的HPCTOP500中奪冠,我國學者開發的超算應用還連續兩次獲得ACM戈登?貝爾獎,說明我國不但能造出世界上速度最快的計算機,而且能在超級計算機上實現其他國家還做不到的實際應用,高性能計算已像航天和高鐵一樣成為中國的「名片」。同時,各國紛紛加強高性能計算研發布局和應用拓展,我國已做好百億億次計算的戰略部署,新一輪競爭已經開始。在此背景下,本文對全球高性能計算髮展態勢進行了剖析和討論。

2主要國家和地區戰略規劃與項目部署

2.1 美國

美國以「國家戰略性計算計劃」為主要綱領,由不同政府部門協同推進未來高性能計算,特別是百億億次計算研發與應用。

2015年7月,美國正式啟動「國家戰略性計算計劃」(National Strategic Computing Initiative,NSCI),旨在使HPC的研發與部署最大程度地造福於經濟競爭與科學發現。NSCI確定了HPC研發的指導原則與目標,界定了參與機構的性質與職責,並設立了協調機構。2016年7月發布的「國家戰略性計算計劃戰略規劃」則在此基礎上,進一步明確了各機構在每一項發展目標中的具體責任。該計劃設定的戰略目標有:加快可實際使用的百億億次計算系統的交付;加強建模、模擬技術與數據分析計算技術的融合;在15年內為HPC系統乃至後摩爾時代的計算系統研發開闢一條可行的途徑;實施整體方案,綜合考慮聯網技術、工作流、向下擴展、基礎演算法與軟體、可訪問性、勞動力發展等諸多因素的影響,提升國家HPC生態系統的可持續能力;創建一個可持續的公私合作關係,確保HPC研發的利益最大化,並實現美國政府、產業界、學術界間的利益共享。

此外,一些政府科研部門也有相應部署和投入,主要包括:

2.1.1 美國國家科學基金會超算系統投資計劃

作為美國國家科學基金會(NSF)「極限數字發展計劃」(XD)的一部分,2014年11月,NSF宣布投資1620萬美元構建兩套超算系統,用於補充開放科學團體現有的資源,使研究人員能在更廣泛的前沿科學領域中利用HPC。這兩套超算系統被分別命名為「橋(Bridges)」和「噴流(Jetstream)」,並於2016年投入使用。

1)「橋」(Bridges)。Bridges獲資960萬美元,位於匹茲堡大學的匹茲堡超級計算中心,重點幫助科學家解決需要處理和移動大量數據、對計算速度要求不高的科學問題,可針對不同的問題和數據量,為用戶提供定製化的內存、數據帶寬、計算能力。

2)「噴流」(Jetstream)。Jetstream獲資660萬美元,分散安置於印第安那大學的泛在技術研究所和德州大學奧斯汀分校的德州先進計算中心(TACC),是全球最大的公共科技雲之一,用於補充美國國家網路基礎設施中基於雲的計算能力,幫助研究人員按需訪問雲計算和數據分析資源,以滿足科學與工程研究群體的多樣化計算需求。

2.1.2 美國陸軍研究實驗室2015—2019年技術實施計劃

2015年1月,美國陸軍研究實驗室(ARL)發布「2015至2019年技術實施計劃」,分別從技術研發和基礎設施建設兩個層面提出美國陸軍對高性能計算研發與建設的短、中、長期目標,如表1和表2所示。

2.1.3 美國能源部下一代超級計算機研發項目

針對「國家戰略性計算計劃」,美國能源部(DOE)於2016年4月推出了「百億億次計算項目」(Exascale Computing Project,ECP),將此前處於初期的「百億億次計算行動計劃」(Exascale Computing Initiative)逐步轉變為正式的DOE項目。ECP旨在解決對未來百億億次系統的有效開發和部署至關重要的硬體、軟體、平台和人才發展需求,使高性能計算為美國經濟競爭力、國家安全和科學發現帶來最大程度的利益。ECP將開發運算性能是當前的千萬億次系統50~100倍甚至更高的超算系統,提供突破性建模與模擬方案以在更短的時間內分析更多數據。

作為十年期項目,ECP重點關注以下四個領域:

1)應用開發:使ECP的應用套件具備可擴展的性能,能在ECP百億億次系統上有效執行。

2)軟體技術:擴展現有的DOE SC和NNSA軟體棧,使其能有效使用百億億次系統。同時開展工具與方法研發,改進生產性能並提升可移植性。

3)硬體技術:資助超算供應商開展創建百億億次系統所需的硬體架構設計研發。

4)百億億次系統:資助測試床和先進系統工程的開發,關注採購功能性百億億次系統所需增量式現場準備和系統擴展的成本。

總額為3980萬美元的首輪經費全額資助了15項應用開發項目和7項種子基金項目,涵蓋45家研究和學術機構,旨在開發側重於可移植性、可用性和可擴展性的先進建模和模擬解決方案,應對DOE在科學發現、清潔能源、國家安全和與國立衛生研究院(NIH)的國家癌症研究所(NCI)合作的精準醫療計劃等方面所面臨的具體挑戰。

2.2 歐盟

2.2.1 ETP4HPC與歐盟高性能計算戰略研究議程

歐洲高性能計算技術平台(ETP4HPC)在歐洲HPC生態系統中發揮著「研發新技術、提升社會經濟效益、協調機構與項目間合作」等多重關鍵作用。2013年12月,ETP4HPC與歐盟委員會簽訂合同制公私夥伴關係(contractual Public-Private Partnerships,cPPP),歐盟「地平線2020」(H2020)計劃對HPC投資7億歐元,而ETP4HPC也將提供匹配研發資金。2015年9月,ETP4HPC與PRACE聯合啟動為期30個月的「歐洲極限數據與計算行動計劃」(EXDCI),以促進歐洲HPC生態系統中關鍵機構和項目之間的合作。

2015年11月,ETP4HPC發布2015年版HPC戰略研究議程(SRA),旨在提出歐洲百億億次計算的路線圖。該議程在原有的六大重點領域外,還提出了新的技術領域和新的概念,以及HPC技術研發四維度(圖1),具體包括:1)新技術研發,為更廣泛的HPC市場提供更多具備競爭性和創新性的HPC系統;2)通過為新技術提供增強的、合適的特性,解決極限規模需求;3)開發新的HPC應用,包括複雜系統(如電網)控制、雲模型、大數據等;4)通過HPC技能培訓和服務支撐,提升HPC解決方案的可用性。

2.2.2 歐盟HPC公私合作夥伴關係

2013年12月,歐盟委員會針對八個領域宣布與歐洲產業界建立合同性公私合作夥伴關係(cPPP),並通過「地平線2020」計劃提供62億歐元,其中HPC cPPP獲得7億歐元的資助,用於攜手技術供應商和用戶開發下一代百億億次超級計算機技術、應用和系統。其預期成果是:制定對產業競爭力、可持續發展、社會和經濟效益具有顯著影響的研究與創新戰略,促進涵蓋整個產業鏈的HPC生態系統,通過提供HPC資源和技術使用的便利條件來擴大用戶群。

2016年5月,歐盟根據其2016—2017工作計劃,發布H2020計劃HPC領域招標公告,此次招標屬於未來新興技術(FET)前瞻計劃的一部分,旨在利用從千萬億次向百億億次計算過渡中出現的新機遇,創建下一代極限性能計算。

2.2.3 歐盟1.4億歐元資助多個HPC項目和卓越中心

2015年9月,歐盟宣布投資1.4億歐元,資助21項「邁向百億億次高性能計算」的HPC項目並新建8所面向計算應用的卓越中心。其中三個項目——ExaNest,ExaNode和ECOSCALE於2016年底合作完成了ARM64 + FPGA架構的百億億次超算機原型。

2.2.4 歐盟框架計劃百億億次計算項目研究進展

歐盟希望在2022年前能建造3台全球頂級的超級計算機,為此H2020之前的FP7框架計劃(2007—2013)資助了8項百億億次計算研究項目,且在2011—2016年間投入的資助超過5000萬歐元。這些項目主要用於解決演算法和應用開發、系統軟體、能源效率、工具和硬體設計等方面的挑戰。

2016年9月,歐盟委員會發布百億億次計算研究概述報告,回顧了FP7所資助計算項目的研究進展,包括:CRESTA,百億億次軟體、工具和應用的合作研究;DEEP/ DEEP-ER,動態的百億億次入口平台及其拓展;Mont-Blanc I +II,面向節能HPC的歐洲路徑,目前已經進入第三階段,計劃在2019年前設計出一個新的高端HPC平台,能以更低的能耗、更高的性能運行真實應用;EPiGRAM,百億億次編程模型,在消息傳遞介面(MPI)並行編程設計中引入和實現新概念,以實現MPI在執行時間和內存消耗方面的可擴展性;EXA2CT,百億億次演算法與先進計算技術;Numexas,面向工程和應用科學中關鍵百億億次計算挑戰的數值方法和工具等。

2.3 日本

2013年12月,日本文部科學省推出百億億次超級計算機研發項目,旨在保持日本在計算科學和技術領域的領先優勢。新的超級計算機「後京」(Post-K)預計於2020年投入使用,速度將是日本現有最快超級計算機「京」的100倍。

新的百億億次超級計算機研發被文部科學省列為「旗艦2020計劃」(Flagship 2020 Project),由日本理化學研究所(RIKEN)的計算科學研究機構(AICS)負責實施。文部科學省2015年8月公布的2016年預算顯示,該計劃2016年獲得了76億日元的撥款,比前一年的39億日元增加了近一倍。

「後京」的研發秉持四項基本的設計方針:能解決實際的社會和科學問題;在能效方面具備國際競爭力;最大程度地利用前任「京」確立的技術、人才和應用;2020年以後也能針對半導體技術的發展實現有效的性能擴展。基於這四項方針,「後京」的開發將通過系統與應用的協同設計(Co-design)進行,一是開發下一代超算系統「後京」,二是面向「後京」的使用開發相應的應用,以解決革命性新葯開發、生命科學計算、災害預測、氣象預測、綠色能源系統實用、宇宙演化分析等9項重要的社會和科學問題。

「後京」的開發分為四個方面:架構開發、協同設計推進、系統軟體開發、應用開發,AICS為此設立了4個專職研發團隊。從預定的計劃來看,「後京」的研發將在2018年完成製造並開始量產,2019年進行設置和調整,2020年投入運行。不過,2016年9月在美國奧斯汀舉行的HPC用戶論壇上,該項目負責人——RIKEN的石川裕表示,正式運行的時間可能會延後1~2年,但並未說明延後的原因。有報道稱,可能是由於半導體設計問題導致的CMOS製造技術尚不成熟,或者是晶元開發的時間比預期要長。

2.4 法國

法國的新一代超級計算機研發主要是通過國立科研機構與企業的合作開展,部分研發項目如下:

法國布爾公司(Bull)於2014年11月公布其百億億次計算的研發計劃,在提高處理器運算速度和數據處理能力的同時,開發超快的互聯技術和更好的冷卻技術,提高能效,並從根本上重新設計軟體。該計劃擬開發一台開放式、高度模塊化並具有最頂級互聯能力的百億億次超級計算機SEQUANA及其配套的軟體棧,以及一系列具有超高內存性能,支持內存資料庫、預處理、後處理和可視化等操作的伺服器。

2015年7月,法國源訊公司(Atos)與法國新能源與原子能委員會(CEA)簽訂合同,約定於2020年向CEA提供百億億次超級計算機「Tera1000」。系統的第一部分組件已在2015年4月交付,原型系統也在2017年建成並投入運行,其理論峰值達到9.3千萬億次/秒、實測峰值達4.9千萬億次/秒(2017年11月)。CEA軍事應用科為其開發了一套生態系統,使其能夠基於Atos的高性能計算技術提供具有競爭力的、耐用的、符合自身需求的超級計算能力。

2015年8月,IBM和法國國家大型計算中心(GENCI)宣布將開展一項合作,充分利用OpenPOWER聯盟帶來的創新技術,以及IBM基於OpenPOWER生態系統開發的最先進HPC技術,加快邁向百億億次計算的步伐。該合作得到POWER加速設計中心的支持,主要致力於為超算系統編寫複雜的科學應用,這些系統的運算速度有望超越十億億次級並邁向百億億次級。此項合作將多點介面技術和共享存儲並行編程技術作為共享內存多處理器編程的第一步,致力於理解編程模型的進化。由於系統邁向百億億次的過程中可能出現潛在變化,此項合作也將考察多種應用程序介面。

3高性能計算面臨的挑戰與趨勢

3.1 計算性能的提升

2015年10月,美國計算社區聯盟(CCC)在《下一代計算的機遇與挑戰》報告中指出,目前氣候建模與模擬等超算應用的精度受限於計算能力。各國都在大力研發下一代的百億億次計算,但科研界擔憂超算應用是否能跟上百億億次計算硬體的發展步伐,一個主要的困難就是沒有人確切地知道未來的百億億次計算架構。多位科學家認為,超算應用面臨著正式建模、靜態分析與優化、運行時分析與優化、自主計算四大關鍵挑戰,並建議基於百億億次系統目前的假設和可用的數據,採取逐步改進的方式將現有超算應用移植到未來的百億億次計算系統上。

3.2 能耗的降低

隨著高性能計算機的速度日益提升,能耗成為一個亟待解決的關鍵問題。各國目前制定的百億億次計算規劃基本將系統功耗目標設定為20MW。但從目前各方面的技術水平來看,要在2020年左右實現這一目標仍存在相當大的困難。目前最「綠色」系統為日本理化所研製的Shoubu system B(2017年11月Green500排名第一),其能效為17 GFlops/w。由此推算,百億億次計算系統的功耗將達到58.8MW,距離既定的能效指標尚有近3倍的差距。

2015年4月,在美國NSF與半導體研究聯盟(SRC)聯合舉行的高能效計算研討會上,與會專家展望了高能效計算研究的機遇。例如,相變的控制對研發能在極低壓下工作的計算設備而言是一條潛在的途徑,傳導則是其他有前景的低功率開關機制之一。在儲能線路中部署絕熱開關也是改善能效的一條途徑。此外,需要更多的關注更高級的架構。例如,磁滯設備具備非易失性邏輯與存儲功能,可以改善現有架構的性能;線性與非線性光學設備和緊湊型光發射器近年來在小型化與能效改善方面都獲得了巨大進步。其他架構研究領域也可能利用新興的設備理念來大幅提升計算能效。相關研究主題包括:異構系統的架構、最大程度減少數據移動的架構、神經形態架構、新的隨機計算方案、近似計算、認知計算等。

3.3 軟體與演算法的開發

GPU已經大幅提高了計算能力,但對新軟體和新演算法的需求仍然迫切,一些重要問題包括:隨著晶片上集成的晶體管數量急劇增加,摩爾定律可能失效的推測將促使計算架構發生重要變化,這就需要新的軟體和演算法能來幫助新的計算架構發揮最大效用;放寬對計算精確度「近乎完美」的要求可能開創一個「近似計算」的新時代,從而更好地解決系統故障。任何對網路基礎設施的投資都需要考慮到軟體的更新和重新開發,演算法、數值方法、理論模型的創新對未來計算能力的提升可能發揮重要作用。另一方面,開展應用數學研究對促進軟體與演算法開發也非常重要。只有在應用數學方面取得進展才能開發出高性能應用程序,從而應對百億億次計算面臨的大量科學與技術挑戰。美國著名計算科學家傑克·唐加拉(Jack Dongarra)建議美國能源部「先進科學計算研究」項目(ASCR)優先開展針對百億億次計算的應用數學研究,以幫助DOE保持在先進計算方面的優勢,包括:對新模型、抽象化、演算法的研發投入大量經費,以充分利用百億億次計算的巨大性能;利用應用數學方法尋找平衡點,以準確區分各項研究是否需要百億億次計算支持。

3.4 硬體架構的發展

硬體架構將更趨多樣化,分別以提升運算性能、能效和數據密集型處理能力為目標的各種架構會陸續出現。處理器由多核向眾核發展,2016年6月的Top500中96套系統使用了眾核加速器技術,其中86套使用了協處理器,另外10套使用了最新的Xeon Phi「KnightsLanding」處理器作為主要的處理單元,它們是Top500上首批將眾核技術作為獨立處理器使用的系統。就互連技術而言,206套系統採用了千兆乙太網技術,187套系統採用了InfiniBand技術,28套系統採用了Intel Omni-Path技術,該技術在2016年6月的Top500榜單上首次出現。

此外,後摩爾時代的新型計算架構是重要研究熱點。《2015國際半導體技術發展路線圖》認為,在經歷50多年的不斷小型化發展之後,晶體管體積將在2021年停止縮減,屆時摩爾定律將失效,該路線圖自2016年起也已停止更新。2016年3月,英特爾宣布延長處理器研發周期,將傳統的研發周期從「製程-架構」的兩步戰略變為「製程-架構-優化」的三步走戰略,業內認為這一策略的轉變意味著摩爾定律正式終結。

隨著摩爾定律的終結,各國政府、企業和學術界都在加大力度研發新一代的計算架構。例如,IBM公司在2014年7月宣布,將在未來5年投資30億美元推動計算技術的發展,其中就涉及面向後硅時代的量子計算和神經形態計算研發;2015年1月,美國空軍研究實驗室提出了2015—2030年在超級計算領域的研發目標,長期目標之一就是實現量子計算、神經形態計算和生物計算等新型計算模式與硬體的集成;美國高級情報研究計劃局正在致力於超導超級計算(包括低溫存儲)的研究;此外,美國桑迪亞國家實驗室正在開展一項名為「超越摩爾定律計算」的計劃,以開發後摩爾時代的計算技術。

4 我國高性能計算戰略部署、進展與提升空間

4.1 我國百億億次計算戰略部署

為進一步在與各國的高性能計算競爭中取得先機,我國將百億億次(E級)超級計算機及相關技術的研究寫入了國家「十三五」規劃,希望在2020年左右實現這一宏偉研究計劃。在2016年啟動的國家「十三五」高性能計算專項課題中,國防科技大學、中科曙光和江南計算技術研究所同時獲批開展E級超級計算原型系統的研製工作,形成了「三頭並進」的局面,擬通過賽馬機制打造我國自主的E級超算系統。

該專項總體目標是:在E級計算機的體系結構,新型處理器結構、高速互連網路、整機基礎架構、軟體環境、面嚮應用的協同設計、大規模系統管控與容錯等核心技術方面取得突破,依託自主可控技術,研製適應應用需求的E級高性能計算機系統,使我國高性能計算機的性能在「十三五」末期保持世界領先水平。

4.2 我國高性能計算研製與應用進展及提升空間

4.2.1 研製能力顯著增強

2016年11月公布的第48期全球超級計算機500強(Top500)榜單上,使用中國自主晶元製造的「神威·太湖之光」以較大的運算速度優勢輕鬆蟬聯冠軍,「天河二號」排名第二。中國超算總體表現出色,以171台上榜數量與美國並列第一。這見證了中國和美國並駕齊驅的超算優勢,也反反了中國超算的快速崛起。

值得注意的是,我國HPC的研製能力已顯著增強,除了國防科技大學、江南計算技術研究所先後研製出最快超算系統外,在第50期Top500榜單中,聯想、浪潮、曙光等3家中國廠商所研製的HPC數量依次排名第二、第三和第五,與美國惠普(第一)和Cray(第四)共同構成全球第一梯隊。另一方面,美國在Top500榜單上的成績已跌至歷史最差。但從HPC研製企業與核心技術看,美國依舊牢牢佔據優勢。最新Top500榜單上有471套HPC使用了英特爾的晶元,比6個月前增加了7台,另有14台採用IBM的晶元。

4.2.2 多領域應用獲得豐碩成果

隨著我國高性能計算的研製不斷取得進步以及相關學科快速發展,我國高性能計算的應用在近年取得了豐碩成果,有較大國際影響的包括:

1)千萬核可擴展大氣動力學全隱式模擬

在2016年11月美國鹽湖城舉行的2016年全球超級計算大會上,中國憑藉「千萬核可擴展大氣動力學全隱式模擬」研究成果一舉獲得「戈登?貝爾」獎。該研究由「神威·太湖之光」提供運算支撐,可有效開展全球公里級氣象預報,與國際主流的大氣動力模式相比,計算速度提升近10倍,與2015年獲得戈登?貝爾獎的項目相比,計算效率提升10倍以上。這是我國超算應用團隊首次獲得有著「超算應用諾獎」美譽的「戈登?貝爾」獎,標誌著我國科研人員正將超級計算的速度優勢轉化為應用優勢。

2)鈦合金微結構演化相場模擬

鈦合金製備工藝複雜,微觀組織形成機制和規律難以通過實驗獲得,常藉助於軟體模擬。相場法能夠模擬微觀組織的演化過程,廣泛應用於新材料的設計。基於「神威·太湖之光」,中科院計算機網路信息中心自主開發了基於可擴展緊緻指數時間差分演算法庫的相場模擬軟體ScETD-PF,支持計算材料科學、計算物理、計算生命科學等學科的科研模擬。

該研究由網路中心和中科院金屬研究所合作開展,首次實現了國際最大規模的鈦合金微結構粗化相場模擬,顯著加快了我國新型鈦合金的設計和工藝優化。計算擴展到800萬核,實現整機規模計算,最大性能達到39.678 PFlops。該應用也入圍2016年「戈登?貝爾」獎提名。

3)高解析度海浪數值模擬

對於海洋模式模擬而言,解析度的提高會帶來計算量的大幅提升。如果水平解析度提高10倍,模式的計算量將增加數百乃至上千倍,是未來E級計算機系統的驅動應用。

國家海洋局第一海洋研究所、青島海洋科學與技術國家實驗室與清華大學合作,在「神威·太湖之光」超級計算機實現了(1/60)°高解析度的全球海洋模式,通過核加速、負載均衡、通信重疊和指令流水等優化手段,模式成功擴展到8,519,680核數,達到最高30.07PFlops的峰值性能,獲得了優異的擴展性與並行效率。該應用同樣入圍2016年「戈登?貝爾」獎提名。

4)非線性大地震模擬

基於「神威·太湖之光」的強大計算能力,由清華大學、國家超級計算無錫中心、山東大學、南方科技大學、中國科技大學、國家並行計算機工程技術研究中心組成的聯合團隊成功設計實現了高可擴展性的非線性大地震模擬工具。該工具充分發揮國產處理器在存儲、計算、通信資源等方面的優勢,可以實現高達18.9PFlops的非線性地震模擬,是國際上首次實現如此大規模下的高解析度、高頻率、非線性塑性地震模擬,對未來的地震災害救援演習、預防預測等研究具有重要的借鑒意義。「非線性大地震模擬」贏得了2017年「戈登?貝爾」獎。

4.3 我國高性能計算的提升空間及建議

我國高性能計算近年取得了巨大發展,既反映了國家經濟實力和創新能力的提升,也說明當前我國的研發與生產需求都十分強勁,尤其是互聯網領域對計算的旺盛需求大力拉動了我國高性能計算的發展。但是,一些核心技術仍未實現突破,加之建設、運營、市場化經驗有限,導致實際發展與建設目標存在一定差距,依然存在較多提升空間。

4.3.1 構建「大」、「小」高性能計算創新生態系統

我國高性能計算的發展到了關鍵時期,必須要在此階段建立起良好的生態系統,方可實現全面領先和持續性進步。從狹義上說,「小」的創新生態系統是要面向處理器研發系統軟體、工具軟體和應用軟體,讓處理器得到廣泛應用。而「大」的創新生態系統是指產業界、學術界和應用部門之間的協調,即把系統研發、應用研發和整個計算基礎設施的研發整合起來,真正形成具有世界競爭力的科學產業和基礎設施。需要通過在教育、研究和產業各個領域更好地開展合作來建設這更大的創新生態環境。

4.3.2 改善科研院所高性能計算設施建設

4.3.3 突破軟體瓶頸,釋放高性能計算設施價值

高性能計算機的壽命通常只有5~7年,並且運行維護費用很高,因此必須快速研製出相關應用程序,才能最大程度發揮其價值。我國高性能計算長期重「硬」輕「軟」,導致基礎並行環境、基礎演算法、高性能數學庫、操作系統等基礎與應用軟體的發展落後於計算機系統的發展,進而導致我國高性能計算設施難以充分發揮作用。目前,我國許多研究機構、高等院校大量使用國外商業軟體、開源軟體,並導致諸多困難:一些軟體甚至只是目標程序,很難對物理模型、計算格式、演算法進行調整、改進;計算規模受限制;計算精度、解析度不高;關鍵應用受到限制。

要使高性能計算在實際應用中真正成為科技創新的重要手段,就必須堅持對基礎與應用軟體和高性能計算機系統的統籌規劃、均衡投資、協調發展。建議成立若干國家並行軟體工程中心,統籌、協調全國各行業並行軟體的研究、開發、推廣和應用,同時採用自研、開源、共享等多種手段,解決國產軟體缺乏和市場佔有率低的問題。

4.3.4 大力培養高素質跨學科人才

高性能計算是一門典型的交叉學科,其內容涉及計算機科學、計算數學、行業應用知識。我國高性能計算的研發人才已具備相當實力,但應用人才相對短缺,特別是缺乏應用軟體和系統軟體方面的專業人才。主要原因在於培養相關人才的門檻高、專業性強,學科交叉協作還未形成風氣,缺乏鼓勵學科交叉合作的具體機制和組織保障。

因此,培養高素質跨學科人才顯得尤為迫切。應建立長期的人才培養戰略,通過科普讓更多年輕人接觸、了解高性能計算,同時擴大設置「高性能計算理論+多學科應用課程」的高校範圍,加大對「懂計算懂專業」的複合型人才培養力度,大力推動該領域多學科的交叉融合。要加強課程建設、師資隊伍建設,還要拓寬人才培養渠道、結合實踐培訓用戶來解決人才不足問題。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 世界科技研究與發展 的精彩文章:

TAG:世界科技研究與發展 |