美國(guó)已經(jīng)確定在2023年實(shí)現(xiàn)
超級(jí)計(jì)算機(jī)的下一個(gè)大飛躍,前提是現(xiàn)在到2023年間的兩次總統(tǒng)選舉和四次國(guó)會(huì)選舉不會(huì)阻止該計(jì)劃。
超級(jí)計(jì)算機(jī)跟政治有聯(lián)系似乎有些奇怪,但隨著這些系統(tǒng)變得越來(lái)越復(fù)雜和昂貴,這需要國(guó)會(huì)的資助。
政治現(xiàn)狀讓超級(jí)計(jì)算機(jī)社區(qū)感到受挫,并且在今年的大型超級(jí)計(jì)算機(jī)會(huì)議SC14推出了新的計(jì)劃,旨在讓研究人員向更廣泛受眾推廣超級(jí)計(jì)算機(jī)好處。
最近來(lái)自歐洲、日本和中國(guó)的競(jìng)爭(zhēng)壓力,美國(guó)的超級(jí)計(jì)算機(jī)資助有望提高,中國(guó)現(xiàn)在運(yùn)行著世界上速度最快的超級(jí)計(jì)算機(jī)。上周美國(guó)能源部宣布為IBM的兩臺(tái)150千萬(wàn)億次系統(tǒng)資助3.25億美元,其中有臺(tái)系統(tǒng)有望實(shí)現(xiàn)300千萬(wàn)億次。
IBM技術(shù)計(jì)算副總裁Dave Turek表示,這些系統(tǒng)的架構(gòu)能力可以支持500千萬(wàn)億次。
一個(gè)exaflop等于一百萬(wàn)的三次方(一個(gè)quintillion是1后面18個(gè)0)。這是美國(guó)在2008年實(shí)現(xiàn)1千萬(wàn)億次(IBM構(gòu)建的系統(tǒng)),或1000萬(wàn)億次浮點(diǎn)運(yùn)算后,超級(jí)計(jì)算機(jī)領(lǐng)域的下一個(gè)偉大的目標(biāo)。1千萬(wàn)億次等于1 quadrillion(1后面15個(gè)0)。
美國(guó)能源部先進(jìn)科學(xué)計(jì)算研究項(xiàng)目的研究部總監(jiān)William Harrod表示,2023年我們將會(huì)有百億億次系統(tǒng)。目前美國(guó)已經(jīng)在下一代系統(tǒng)花費(fèi)將近3億美元,這仍然是很低的水平。
美國(guó)國(guó)會(huì)將不得不批準(zhǔn)更多資金來(lái)推動(dòng)研究,以滿(mǎn)足這個(gè)發(fā)展時(shí)間表。雖然國(guó)會(huì)的支持現(xiàn)在看起來(lái)很好,但未來(lái)無(wú)法預(yù)測(cè)。
構(gòu)建萬(wàn)億億次系統(tǒng)面臨的技術(shù)挑戰(zhàn)是多方面的。這包括解決軟件問(wèn)題來(lái)實(shí)現(xiàn)幾十萬(wàn)計(jì)算核心的并行運(yùn)行;解決可靠性和靈活性需求;以及能源效率。
不平凡最后一個(gè)問(wèn)題能源效率得到了很多的關(guān)注。對(duì)于每兆瓦功率,每年的費(fèi)用大約是100萬(wàn)美元。計(jì)劃在2017年運(yùn)行的150千萬(wàn)億次系統(tǒng)將運(yùn)行在10兆瓦。
頂級(jí)國(guó)家研究人員承認(rèn),美國(guó)面臨競(jìng)爭(zhēng)壓力來(lái)實(shí)現(xiàn)百億億次,但也需要理解軟件堆棧開(kāi)發(fā)很復(fù)雜,必須需要國(guó)際合作。
歐洲也有與美國(guó)類(lèi)似的時(shí)間框架,而日本此前也宣布到2020年實(shí)現(xiàn)百億億次。但Riken理化學(xué)研究所高級(jí)計(jì)算科學(xué)研究所的副主任Akinori Yonezawa在周二接受采訪(fǎng)時(shí)表示,其目標(biāo)是到2020年構(gòu)建200到600千萬(wàn)億次系統(tǒng),而不是萬(wàn)億次系統(tǒng),。
上個(gè)月,Riken選擇富士通來(lái)為這個(gè)系統(tǒng)進(jìn)行基本設(shè)計(jì)。
在2008年,美國(guó)第一個(gè)千萬(wàn)億次系統(tǒng)來(lái)自于IBM公司。如果摩爾定律仍然適用于高性能計(jì)算,美國(guó)應(yīng)該到2018年達(dá)到百億億次,但很明顯在技術(shù)問(wèn)題不太可能滿(mǎn)足這個(gè)日期。
百億億次并不是容易實(shí)現(xiàn)的事情。
IBM的Turek表示,現(xiàn)在構(gòu)建百億億次系統(tǒng)需要巨大數(shù)量的GPU,但問(wèn)題是這種系統(tǒng)用來(lái)支持什么?
現(xiàn)在,衡量系統(tǒng)執(zhí)行浮點(diǎn)速度的Linpack基準(zhǔn)被廣泛用來(lái)確定超級(jí)計(jì)算機(jī)的能力和500強(qiáng)排名。但對(duì)于百億億次系統(tǒng),更有用的指標(biāo)可能是應(yīng)用程序的性能:該系統(tǒng)對(duì)真實(shí)世界的使用帶來(lái)多大程度的改進(jìn)。
Turek表示,IBM正在構(gòu)建的
DOE系統(tǒng)將助力實(shí)現(xiàn)百億億次系統(tǒng),這是降低風(fēng)險(xiǎn)的方法,因?yàn)槲覀冎肋@里需要大量的學(xué)習(xí)和創(chuàng)新