中國超算能否再奪“戈登貝爾獎”?獲戈登貝爾獎的條件
鄭緯民教授在HPC China 2019上。 大會組委會供圖
8月22日,由中國計算機學(xué)會(CCF)主辦,中國計算機學(xué)會高性能計算專業(yè)委員會、內(nèi)蒙古和林格爾新區(qū)管理委員會、清華大學(xué)、內(nèi)蒙古大學(xué)共同承辦,北京并行科技股份有限公司協(xié)辦的“2019 CCF 全國高性能計算學(xué)術(shù)年會”(HPC China 2019)于內(nèi)蒙古呼和浩特舉行。
《中國科學(xué)報》記者在此次年會上獲悉,基于我國已建成的超大規(guī)模高性能計算機,中國超算應(yīng)用團隊還將繼續(xù)沖擊2019年的戈登貝爾獎,該獎項將于11月在美國舉行的國際超算大會上揭曉。
“戈登貝爾獎”是國際上高性能計算應(yīng)用領(lǐng)域的最高學(xué)術(shù)獎項,被稱為“超算領(lǐng)域的諾貝爾獎”。拜中國最強超算“神威·太湖之光”所賜,中國超算應(yīng)用團隊曾在2016年、2017年連續(xù)兩奪“戈登貝爾獎”——在此之前,美國、日本壟斷該獎項長達近30年。
中國超算應(yīng)用團隊還能否在2019年甚至未來再次斬獲這一殊榮?戈登貝爾獎在引領(lǐng)超級計算機未來哪些發(fā)展趨勢?
戈登貝爾獎的兩個基本條件
怎么才能獲得戈登貝爾獎?在HPC China 2019上,清華大學(xué)計算機系教授、大會共同主席鄭緯民總結(jié)了兩個最基本的條件:第一,應(yīng)用程序在TOP500前幾名機器上全機運行;第二,應(yīng)用程序有很好的性能。
這兩個條件,也從側(cè)面解釋了中國多年來沒能獲得戈登貝爾獎的原因——中國超算第一次排名世界第一,是2010年11月的“天河一號A”。短時間內(nèi),中國超算應(yīng)用還需要孕育。
也就是說,硬件水平只是基本要素之一。正所謂“硬件搭臺、軟件唱戲”,戈登貝爾獎要求,應(yīng)用程序要在頂級的硬件的舞臺上唱出精彩的戲才行。
“雖然說戈登貝爾獎是拜‘神威·太湖之光’所賜,但這也只是獲得該獎項的硬件基礎(chǔ)。如果沒有高效、創(chuàng)新、面向解決重大問題的應(yīng)用被開發(fā)出來,也無法獲得戈登貝爾獎。”HPC China 2019上一位要求匿名的業(yè)內(nèi)專家告訴《中國科學(xué)報》。
2016年代表中國首次摘得戈登貝爾獎的團隊負責(zé)人、中科院軟件所研究員楊超也告訴記者,那些軟件水平足夠高、方法有創(chuàng)新并且對今后的應(yīng)用有示范意義,入圍和得獎的機會才夠大。
問題是,什么樣的超算應(yīng)用對未來有示范意義?
在HPC China 2019大會主論壇上,鄭緯民對入圍2018年戈登貝爾獎的6個超算應(yīng)用項目進行了分析,試圖回答上述問題。
2018年戈登貝爾獎的“風(fēng)向”
從鄭緯民提供的2018年ACM 戈登貝爾獎入圍名單可以看到,2018年,中國超算應(yīng)用團隊只有一支“獨苗”挺進“戈登貝爾獎”決賽名單。記者通過查詢資料得知,這支隊伍由清華大學(xué)林恒博士和卡塔爾計算研究所、搜狗等7家機構(gòu)的研究人員組成,所開發(fā)的應(yīng)用名為:基于神威·太湖之光的超大規(guī)模圖計算系統(tǒng)“神圖”。
鄭緯民介紹說,“神圖”圖計算框架項目探索了在超算系統(tǒng)上如何開展極大規(guī)模圖數(shù)據(jù)的高效處理,是一個典型的運行在超級計算機上的人工智能應(yīng)用。遺憾的是,最終“神圖”圖計算框架項目未能為中國拿下2018年的戈登貝爾獎。
2018年戈登貝爾獎頒給了兩個來自美國的團隊,分別是橡樹嶺國家實驗室應(yīng)用超級計算機來應(yīng)對藥物流行病,通過基因組學(xué)分析研究藥物在人群中的使用;以及勞倫斯伯克利國家實驗室“用E級規(guī)模的深度學(xué)習(xí)進行氣候分析”,通過大規(guī)模的深度學(xué)習(xí)識別極端天氣。
這兩個超算應(yīng)用都是當(dāng)今排名世界第一的Summit超級計算機上實現(xiàn)的。鄭緯民介紹說,其中,“應(yīng)用超級計算機來應(yīng)對藥物流行病”是一個傳統(tǒng)的科學(xué)研究應(yīng)用,屬于基因組學(xué)計算領(lǐng)域,由美國能源部下屬的橡樹嶺國家實驗室的研究團隊領(lǐng)銜完成;而“用E級規(guī)模的深度學(xué)習(xí)進行氣候分析”則是一個運行在超級計算機上的人工智能應(yīng)用,由勞倫斯伯克利國家實驗室和英偉達公司的聯(lián)合研究團隊完成。
鄭緯民評價道,這兩項研究,前者是高性能計算與生物信息學(xué)、醫(yī)學(xué)相結(jié)合的一個典范,后者則是“首個可以有效擴展到近3萬塊(27360塊)GPU加速卡的深度學(xué)習(xí)應(yīng)用”,成為其最大亮點。
在其余四個入圍戈登貝爾獎的應(yīng)用中,鄭緯民介紹說,“引入了混合精度計算來充分發(fā)揮GPU計算資源的效能”的“城市地震災(zāi)害模擬項目”,和“探索了在超級計算機上如何開展極大規(guī)模圖數(shù)據(jù)的高效處理”的“‘神圖’圖計算框架項目”,都是典型的運行在超級計算機上的人工智能應(yīng)用。
從上述6個入圍戈登貝爾獎項目的分析中不難看出,獲獎的“用E級規(guī)模的深度學(xué)習(xí)進行氣候分析”項目,與入圍的“城市地震災(zāi)害模擬項目”“‘神圖’圖計算框架項目”,均屬于超算與人工智能融合的范例——超算上的人工智能應(yīng)用已經(jīng)占據(jù)了半壁江山。
也正因此,鄭緯民也將“人工智能應(yīng)用有望成為超算的主流應(yīng)用之一”總結(jié)為未來超級計算機與應(yīng)用的兩個重要發(fā)展趨勢之一。
未來如何走得更遠
鄭緯民總結(jié)的另一個趨勢是,異構(gòu)架構(gòu)在超算系統(tǒng)構(gòu)建層面被廣泛接受。他認為,目前全球超算TOP10的系統(tǒng)中,異構(gòu)架構(gòu)超算已經(jīng)占據(jù)了七成。盡管“加速器異構(gòu)”和“異構(gòu)眾核”之爭仍在繼續(xù),異構(gòu)架構(gòu)已成為構(gòu)建頂級超算系統(tǒng)的大勢所趨。
記者觀察到,在全球TOP10的超算中,以英偉達GPU為代表構(gòu)建的異構(gòu)超算占了5席??紤]到人工智能在科學(xué)與工程計算中越來越廣泛的應(yīng)用,這也為人工智能應(yīng)用與超算的融合打下了硬件基礎(chǔ)。
算力一直被認為是人工智能再次騰飛的重要基礎(chǔ)之一。而隨著深度神經(jīng)網(wǎng)絡(luò)規(guī)模的擴大,最新的網(wǎng)絡(luò)生成和訓(xùn)練往往需要數(shù)萬GPU小時(如BERT、NASNet等)甚至更多。
對此,鄭緯民說:“具有頂級計算能力的超算系統(tǒng)理應(yīng)為大規(guī)模人工智能應(yīng)用提供助力,不斷拓展后者的技術(shù)邊界。”
再回到2018年戈登貝爾獎入圍名單上。從該獎的選擇來看,有3個人工智能應(yīng)用得以入圍,其中1個最終得獎。
“2018年的戈登貝爾獎選擇大規(guī)模深度學(xué)習(xí)應(yīng)用,入圍應(yīng)用中人工智能相關(guān)的項目也前所未有地占據(jù)了半壁江山,這一切都預(yù)示著人工智能與超算的結(jié)合將越來越緊密。”鄭緯民說。
中國到底能否在2019年甚至未來再次斬獲這一殊榮?我們拭目以待。但不容忽視的是,以深度學(xué)習(xí)為代表的人工智能算法,已經(jīng)影響了硬件的發(fā)展方向,并且會在將來進一步擴大其影響。
中科院計算所研究員、國家超級計算濟南中心主任張云泉也表示,以科學(xué)計算為代表的傳統(tǒng)高性能計算程序必須接受這一個事實,只有主動擁抱這一個事實,并尋求兩者的結(jié)合點,才有可能在未來走得更遠。(趙廣立)