當(dāng)前位置:首頁(yè) >  IDC >  云計(jì)算 >  正文

揭秘超算中心憑什么登上中國(guó)高性能計(jì)算機(jī)Top100榜單第三名

 2021-11-04 14:25  來(lái)源: 互聯(lián)網(wǎng)   我來(lái)投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過(guò)

計(jì)算的商業(yè)化,何以搭上了「碳中和」的列車?

作者 | 陳彩嫻

編輯 | 岑峰

在 2020 年中國(guó)高性能計(jì)算機(jī)性能 TOP100 的排行榜中,部署在國(guó)家超算中心(無(wú)錫)的「神威 · 太湖之光」依然穩(wěn)居第一,國(guó)家超算中心(廣州)的「天河二號(hào)升級(jí)系統(tǒng)」位列第二,而榮登榜眼的,卻是此前名不見(jiàn)經(jīng)傳的北京超級(jí)云計(jì)算中心 A 分區(qū)。

這一排名,讓許多此前并不知道北京超級(jí)云計(jì)算中心的朋友大吃一驚:「超級(jí)云計(jì)算」是什么?北京超級(jí)云計(jì)算中心的「A 分區(qū)」究竟實(shí)力何在?

盡管大家對(duì) A 分區(qū)的研制廠商戴爾(DELL)多有耳聞,但對(duì) A 分區(qū)所部署的北京超級(jí)云計(jì)算中心卻幾乎一無(wú)所知,顧名思義,更容易將其與國(guó)家超算中心混淆。

這座超算中心成立于 2011 年,雖由中國(guó)科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心孵化、北京懷柔區(qū)政府支持成立,但卻不在國(guó)家的 8 個(gè)超算中心之列。

眾所周知,我國(guó)第一個(gè)國(guó)家超算中心成立于 2009 年,由天津?yàn)I海新區(qū)與國(guó)防科技大學(xué)合作共建,斥資 6 億。此后,國(guó)家又陸續(xù)在多個(gè)東部城市建立了超算中心:濟(jì)南、深圳、廣州、長(zhǎng)沙、無(wú)錫、鄭州、昆山……

其「政府 + 高?!沟暮献髂J诫m與國(guó)家超算相似,但自創(chuàng)立之初,北京超級(jí)云計(jì)算中心的核心理念便注定了它的不同。

從 2011 年到 2020 年,北京超級(jí)云計(jì)算中心何以從一個(gè)籍籍無(wú)名的超算中心,成為躋身于中國(guó)高性能計(jì)算機(jī) TOP100 榜單一員、并僅次于兩個(gè)國(guó)家超算中心的明星超算呢?

在中國(guó)高性能計(jì)算盛會(huì) CCF HPC China 2021 中,我們有幸采訪了北京超級(jí)云計(jì)算中心的 CTO 郭宇,與他一同探究該中心的「成名之道」。

從建設(shè)的模式來(lái)看,北京超級(jí)云計(jì)算中心與國(guó)家超算中心有許多不同之處,其中,最大的不同便是:國(guó)家超算中心注重科研支持,而北京超級(jí)云計(jì)算中心的核心理念是超算商業(yè)化。

按照郭宇的話說(shuō),是「像設(shè)計(jì)產(chǎn)品一樣設(shè)計(jì)超算?!?/p>

被譽(yù)為「國(guó)之重器」的超級(jí)計(jì)算機(jī),向來(lái)是大國(guó)之間的必爭(zhēng)之地。長(zhǎng)久以來(lái),這也形成了國(guó)家超算獨(dú)當(dāng)一面、民間超算不為人知的局面。然而,任一行業(yè)的發(fā)展,必然是多方力量的融合與交匯,百花齊放,從而共同推進(jìn)領(lǐng)域的前進(jìn)。

那么,在中國(guó)的超算領(lǐng)域內(nèi),北京超級(jí)云計(jì)算中心的位置在哪里??jī)?yōu)勢(shì)是什么?

1

超算市場(chǎng)的形成

回顧 2011 年北京超級(jí)云計(jì)算中心的成立節(jié)點(diǎn),除了兩個(gè)國(guó)家超算中心(天津與濟(jì)南)的成立所帶來(lái)的信號(hào),超算市場(chǎng)的爆發(fā)早在過(guò)去的五年便有了行業(yè)的鋪墊與基礎(chǔ):

2005 年以前,CPU 處理器處于「單核時(shí)代」,一個(gè) CPU 只有一個(gè)核心。如果一臺(tái)服務(wù)器上有兩個(gè) CPU,那么,搭建一個(gè) 1024 核的 CPU 則需要 512 個(gè)節(jié)點(diǎn),12 個(gè)機(jī)柜,因?yàn)橐粋€(gè)機(jī)柜最多只能裝40個(gè)節(jié)點(diǎn)。而每個(gè)機(jī)柜的寬度為 60 公分,12 個(gè)機(jī)柜則是 7.2 米,相當(dāng)于一個(gè)普通教室的寬度。

但從 2006 年開(kāi)始,CPU 處理器開(kāi)始進(jìn)入了「雙核」、并逐步拓展到「多核」時(shí)代。雙核處理器的出現(xiàn),基于 x86 的計(jì)算架構(gòu),英特爾與 AMD 在 CPU 服務(wù)器市場(chǎng)中的主導(dǎo)地位也就此形成:

2006 年年中,AMD 率先推出 AM2 平臺(tái)。兩個(gè)月后,英特爾發(fā)布 Conroe,性能直接提高 40%,與此同時(shí),功耗也降低了 40%。但英特爾并不「就此罷休」,同年 11 月又直接推出全新的四核處理器 Kentsfield,直接把 CPU 推進(jìn)了「多核時(shí)代」。

與單核的 CPU 相比,多核 CPU 的并行處理能力更強(qiáng)、計(jì)算密度也更高,并大大減少了散熱與功耗。后來(lái),CPU 出現(xiàn)了 8 核、12 核、16 核……目前一個(gè) CPU 最高已能達(dá)到 64 核。對(duì)于許多關(guān)注高性能計(jì)算的行業(yè)從事人員來(lái)說(shuō),他們認(rèn)為,多核 CPU 必然會(huì)帶來(lái)計(jì)算與任務(wù)的并行化,也就是說(shuō),超算市場(chǎng)在未來(lái)會(huì)迎來(lái)爆發(fā)。

因此,回顧超算市場(chǎng)的發(fā)展歷史,在 CPU 進(jìn)入「多核時(shí)代」后,北京超級(jí)云計(jì)算中心的成立,是卡在了CPU算力爆發(fā)的起點(diǎn)。但當(dāng)時(shí),北京超級(jí)云計(jì)算中心還未正式開(kāi)始商業(yè)化的探索,前期工作也主要以維護(hù)中科院計(jì)算機(jī)網(wǎng)絡(luò)信息中心的超算集群,支持院內(nèi)科研項(xiàng)目為主。

除了技術(shù)的加持,國(guó)家超算中心的陸續(xù)成立,也逐漸在國(guó)內(nèi)孵化了一個(gè)算力的市場(chǎng)。

國(guó)家超算中心的建設(shè)模式是:科技部與地方政府各出一部分資金建設(shè)好國(guó)家超算中心后,在運(yùn)營(yíng)階段,超算中心的部分運(yùn)營(yíng)費(fèi)用由地方政府的財(cái)政補(bǔ)貼,同時(shí),國(guó)家部委和地方政府向部分高??蒲腥藛T開(kāi)放課題申請(qǐng),由高??蒲腥藛T從課題經(jīng)費(fèi)中支出部分資金到國(guó)家超算中心去采購(gòu)計(jì)算資源。

在這樣的模式下,國(guó)內(nèi)逐漸形成了一個(gè)商業(yè)循環(huán)的算力市場(chǎng)。隨著國(guó)家超算中心的出現(xiàn),科研院所與高校逐漸縮減自建超算的規(guī)模,增加對(duì)外部超算資源的采購(gòu)。如此一來(lái),超算市場(chǎng)的用戶越來(lái)越多,對(duì)超算的需求也不斷增加。當(dāng)市場(chǎng)擴(kuò)大到一定的程度,必然會(huì)出現(xiàn)分化,分為尖端超算市場(chǎng)、通用超算市場(chǎng)與行業(yè)超算市場(chǎng)。

對(duì)于國(guó)家超算中心來(lái)說(shuō),服務(wù)如此分化明顯的市場(chǎng)并不是一件易事,且國(guó)家超算中心存在的目的主要是支持國(guó)家大課題(如航空、宇宙、氣象等)、推進(jìn)科研進(jìn)步。這就造成了超算市場(chǎng)的服務(wù)縫隙:海量需要超算資源的小課題用戶在提出需求時(shí),并不能得到滿足。

正是看到超算市場(chǎng)的這一縫隙,2018 年,北京超級(jí)云計(jì)算中心開(kāi)始了超算商業(yè)化的探索,希望能夠提供「隨需擴(kuò)容」的計(jì)算服務(wù),滿足尖端超算以外的大規(guī)模通用超算市場(chǎng)。

2

超算商業(yè)化探索

中國(guó)高性能計(jì)算機(jī) TOP100 的榜單排名由超級(jí)計(jì)算機(jī)計(jì)算能力決定,而計(jì)算能力主要由超級(jí)計(jì)算機(jī)的單節(jié)點(diǎn)性能與集群規(guī)模決定。

北京超級(jí)云計(jì)算 A 分區(qū)的 Linpack 測(cè)試性能達(dá) 3.743PFlops,計(jì)算峰值性能達(dá) 7.035PFlops,CPU 核數(shù)達(dá)到 192000,幾乎是第四名往后的計(jì)算機(jī)的三倍及以上。

據(jù)郭宇介紹,A 分區(qū)從 2019 年年底開(kāi)始建設(shè),而后在 2020 年逐步擴(kuò)容到 3000 節(jié)點(diǎn),背后的原因并不是為了爭(zhēng)奪 TOP3,而是為了滿足客戶的需求。

在郭宇看來(lái),國(guó)內(nèi)的超算市場(chǎng)可以大致分為三類:尖端超算、通用超算與行業(yè)超算。其中,國(guó)家超算中心所服務(wù)的需求市場(chǎng),便主要是尖端超算市場(chǎng),滿足尖端超算需求的超級(jí)計(jì)算機(jī),以難度高、設(shè)計(jì)性能平衡為主,要兼顧計(jì)算、訪存、通信與 I/O 等,服務(wù)對(duì)象是國(guó)家級(jí)的科研項(xiàng)目,重點(diǎn)是出成果,而不是盈利。

而北京超級(jí)云計(jì)算中心的目標(biāo)市場(chǎng)是通用超算,主要面向萬(wàn)核以下(尤其是千核以下)的應(yīng)用,為需求不一的海量用戶提供租賃式超算服務(wù)。對(duì)于北京超級(jí)云計(jì)算中心來(lái)說(shuō),他們的目標(biāo)是超算的商業(yè)化運(yùn)營(yíng),實(shí)現(xiàn)超算業(yè)務(wù)的盈利,反哺到中心建設(shè)的投入中,實(shí)現(xiàn)自給自足、靈活外延的正循環(huán)。

「讓計(jì)算不排隊(duì)」,是北京超級(jí)云計(jì)算中心的核心理念。

從 2011 年成立至今,北京超級(jí)云計(jì)算中心經(jīng)歷了兩個(gè)主要的階段:

剛成立的幾年,北京超級(jí)云計(jì)算中心以運(yùn)營(yíng)中科院體系內(nèi)的超算為主,包括中科院計(jì)算機(jī)網(wǎng)絡(luò)信息中心在 2014 年推出的超級(jí)計(jì)算機(jī)「元」、2015 年的「元」二期等等。在這一階段,北京超級(jí)云計(jì)算中心的建設(shè)模式、運(yùn)營(yíng)模式與國(guó)家超算中心的體系有許多相同之處。

到了 2017 年,他們逐漸發(fā)現(xiàn)了上述所說(shuō)的國(guó)家超算中心無(wú)法滿足的外溢市場(chǎng)需求。隨著國(guó)內(nèi)科研發(fā)展的深入推進(jìn),高校教師對(duì)計(jì)算的需求越來(lái)越大,超算的用戶類型也越來(lái)越多,應(yīng)用越來(lái)越復(fù)雜,用戶對(duì)計(jì)算機(jī)的服務(wù)要求也越來(lái)越高。

比方說(shuō),有些用戶做計(jì)算,并不是簡(jiǎn)單地將一個(gè)程序放到超級(jí)計(jì)算機(jī)上就可以直接運(yùn)行,而是需要在Linux 命令行窗口下將源代碼進(jìn)行編譯、調(diào)優(yōu)、集成甚至更復(fù)雜的適配移植,這對(duì)廣大只熟悉 Windows 操作系統(tǒng)的用戶來(lái)說(shuō)過(guò)于復(fù)雜。

國(guó)家超算中心的主要任務(wù)是支持重量級(jí)的科研項(xiàng)目,取得出色的學(xué)術(shù)成果,如此一來(lái),國(guó)家超算中心的計(jì)算資源自然會(huì)優(yōu)先分配給重要的科研團(tuán)隊(duì),這就導(dǎo)致了許多中小用戶享受不到好的服務(wù),出現(xiàn)「排隊(duì)計(jì)算」的情況。

基于這一行業(yè)需求,北京超級(jí)云計(jì)算中心便思考從商業(yè)運(yùn)營(yíng)的角度去解決國(guó)家超算中心的這部分外溢需求,根據(jù)這部分通用超算客戶需求設(shè)計(jì)超級(jí)計(jì)算機(jī)和超算服務(wù)產(chǎn)品,通過(guò)靈活的方式將計(jì)算資源提供給超算市場(chǎng)的中小微「散戶」。

于是,2018 年,北京超級(jí)云計(jì)算中心發(fā)布了「中國(guó)科技云 · 超算云」,開(kāi)始了超算商業(yè)化的探索征程。

他們以云服務(wù)的方式輸出超算資源,注重商業(yè)化運(yùn)營(yíng),遵循「隨需供應(yīng)」、「按需擴(kuò)容」的理念,在兩年間占領(lǐng)了一定的超算市場(chǎng),贏取了客戶的信任,在吸引更多中小用戶的過(guò)程中對(duì) A 分區(qū)進(jìn)行了擴(kuò)容與提升,最終在 2020 年贏得了中國(guó)高性能計(jì)算機(jī) TOP100 排行榜的第三名。

郭宇表示:「贏得 TOP3 是結(jié)果,不是目的。我們打造超算,本心是為了服務(wù)客戶,獲得該榮譽(yù)是錦上添花?!?/p>

相對(duì)于聚焦 TOP3 的排名,郭宇更希望大家看到 A 分區(qū)背后的北京超級(jí)云計(jì)算中心及其獨(dú)特的建設(shè)與運(yùn)營(yíng)模式。

3

關(guān)于「計(jì)算」模式的新思考

郭宇提出了一個(gè)有意思的觀點(diǎn):作為一種「產(chǎn)品」,超算的獨(dú)特之處在于,在用戶購(gòu)買超算資源時(shí),用戶需要的并不是超級(jí)計(jì)算機(jī),而是想要解決問(wèn)題。就像人們?cè)谫?gòu)買電鉆時(shí),他們想要的并不是電鉆,而是電鉆在墻上鉆出的洞。

所以,在市場(chǎng)上推廣計(jì)算資源時(shí),北京超級(jí)云計(jì)算中心往往是強(qiáng)調(diào)「客戶服務(wù)」,而不只是中心的資源情況。

從 A 分區(qū)來(lái)看,我們不難發(fā)現(xiàn),北京超級(jí)云計(jì)算中心與國(guó)家超算中心的模式多有不同:

首先是建設(shè)周期。國(guó)家超算中心由科技部或地方政府出資,超級(jí)計(jì)算機(jī)的項(xiàng)目申報(bào)需要經(jīng)過(guò)層層審批,建設(shè)周期一般為 3-5 年,而 A 分區(qū)由北京超級(jí)云計(jì)算中心根據(jù)市場(chǎng)需求決定。此外,A 分區(qū)的建設(shè)主要基于市場(chǎng)上已有的技術(shù)設(shè)備,減少了技術(shù)攻關(guān)的時(shí)間成本。

比如,A 分區(qū)從 2019 年年底開(kāi)始建設(shè),從一個(gè)試驗(yàn)性的小集群到面向用戶開(kāi)放,2020 年年中擴(kuò)容,只用了5周便擴(kuò)容 1000 個(gè)節(jié)點(diǎn),后續(xù)又逐步擴(kuò)容至3000節(jié)點(diǎn)。

其次是分布位置。從地圖上看,我們不難發(fā)現(xiàn),國(guó)家超算中心基本分布在東部城市,而北京超級(jí)云計(jì)算中心的超算則主要分布在中西部,尤其是西部。A 分區(qū)便是分布在寧夏。超算中心是「耗電大戶」,從商業(yè)運(yùn)營(yíng)的角度看,西部的電價(jià)明顯更低。

在建設(shè) A 分區(qū)的時(shí)候,國(guó)家還沒(méi)有發(fā)布十四五計(jì)劃,「碳達(dá)峰」與「碳中和」的概念還未興起。郭宇談道,從北京超級(jí)云計(jì)算中心的角度來(lái)看,他們?cè)诮ㄔO(shè) A 分區(qū)時(shí),主要是遵循商業(yè)運(yùn)營(yíng)的邏輯,而今年「雙碳」熱點(diǎn)出現(xiàn)后,他們意外地發(fā)現(xiàn),自己的路線竟契合了國(guó)家的「雙碳」戰(zhàn)略。

「西部有風(fēng)力發(fā)電、光伏發(fā)電,能源豐富,而且年平均氣溫比較低,十分適合計(jì)算中心的生存,所以我們將西部作為主要的節(jié)點(diǎn)。而且超算業(yè)務(wù)對(duì)實(shí)時(shí)通訊的需求不高,用戶更關(guān)心的是產(chǎn)品的價(jià)格,至于機(jī)器是在本地、還是在幾千公里以外的西部,他們并不關(guān)心?!构罱忉?。

北京超級(jí)云計(jì)算中心面向通用超算,用戶數(shù)量大,符合長(zhǎng)尾效應(yīng)。郭宇談道:「有這些特點(diǎn)的市場(chǎng),是比較適合用互聯(lián)網(wǎng)的方式去服務(wù)的。一是降低單用戶的成本,二是貼身服務(wù)。」

所以,無(wú)論是計(jì)算選址的確定,還是「超算 + 云服務(wù)」的互聯(lián)網(wǎng)運(yùn)營(yíng)模式,都體現(xiàn)了北京超級(jí)云計(jì)算中心在計(jì)算供應(yīng)中注重靈活與性價(jià)比的特點(diǎn)。

從 A 分區(qū)所搭配的 CPU 來(lái)看,也可窺見(jiàn)北京超級(jí)云計(jì)算中心的商業(yè)運(yùn)營(yíng)理念:

A 分區(qū)采用的是 AMD 在 2019 年推出的第二代 EPYC(霄龍)服務(wù)級(jí)處理器,代號(hào)羅馬(Rome),基于 7nm 工藝,搭載 64 核心 128 線程,在提升核心數(shù)量的同時(shí)也提升了時(shí)鐘速度,加速頻率可達(dá) 3.4GHz。

從計(jì)算機(jī)的角度來(lái)看,計(jì)算總共可以分為 4 種類型:計(jì)算密集型、訪存密集型、存儲(chǔ)密集型(I/O 密集型)與網(wǎng)絡(luò)通信密集型。北京超級(jí)云計(jì)算中心的主要客戶是訪存密集型的應(yīng)用, A 分區(qū)用戶的特點(diǎn)是:計(jì)算規(guī)模不大,價(jià)格敏感。而羅馬處理器主頻適中,計(jì)算性能適中,能耗低,性價(jià)比高,顯然更有利于商業(yè)運(yùn)營(yíng)。

郭宇坦言,北京超級(jí)云計(jì)算中心的目標(biāo)并不是打造出像「神威 · 太湖之光」或「天河二號(hào)升級(jí)系統(tǒng)」這樣各方面性能均衡又出色的超級(jí)計(jì)算機(jī),而是找到自己的市場(chǎng)定位,為目標(biāo)用戶提供適合他們的超算方案。

根據(jù)處理器的類別,北京超級(jí)云計(jì)算中心的超算分區(qū)可以劃分為四大系列:

基于 AMD 芯片的 A 分區(qū)與 M 分區(qū),以及 A 分區(qū)的加強(qiáng)版「A6 分區(qū)」

基于英特爾芯片的 T 分區(qū)與 L 分區(qū)

基于國(guó)產(chǎn)芯片的分區(qū)

基于英偉達(dá)芯片的 AI 智算云,比如 N17、N19 區(qū)

根據(jù)不同用戶的需求,北京超級(jí)云計(jì)算中心設(shè)立了不同的分區(qū)去滿足這些需求。比如,榮登 2020 年中國(guó)高性能計(jì)算機(jī) TOP100 榜單的 A 分區(qū)便是專門針對(duì)計(jì)算密集型與訪存密集型的用戶,存儲(chǔ)性能加強(qiáng)的 I/O 分區(qū)專門面向 I/O 密集型用戶等等。

「中國(guó)科技云 · 超算云」匯聚了國(guó)家超算中心、互聯(lián)網(wǎng)云計(jì)算中心等資源,可以為用戶提供定制化的計(jì)算服務(wù)。同時(shí),他們揭開(kāi)了高性能計(jì)算的「神秘面紗」,為用戶提供運(yùn)行問(wèn)題解答、參數(shù)配置優(yōu)化、定制化腳本編寫(xiě)等一系列服務(wù),更有一對(duì)一專屬微信群、7 × 24 小時(shí)人工值守與 5 分鐘快速響應(yīng)等機(jī)制。

4

自主研發(fā)離不開(kāi)計(jì)算

近年來(lái),越來(lái)越多企業(yè)高舉「自主研發(fā)」的旗幟。與此同時(shí),產(chǎn)品的迭代周期加快。為了快速滿足市場(chǎng)的需求,研發(fā)人員會(huì)越來(lái)越多地利用數(shù)字化技術(shù)進(jìn)行模擬仿真,其間產(chǎn)生大量數(shù)據(jù),對(duì)計(jì)算的需求也會(huì)越來(lái)越多。

事實(shí)上,從 2010 年以來(lái),許多企業(yè)也陸續(xù)建立了計(jì)算中心,但他們同樣面臨建設(shè)周期長(zhǎng)、內(nèi)部計(jì)算資源協(xié)調(diào)難、計(jì)算排長(zhǎng)隊(duì)的現(xiàn)象。企業(yè)一般是基于項(xiàng)目的優(yōu)先級(jí)進(jìn)行計(jì)算資源的分配,但人工協(xié)調(diào)的效率較低,影響了研發(fā)項(xiàng)目的進(jìn)展。

郭宇認(rèn)為,隨著人們對(duì)云計(jì)算優(yōu)勢(shì)的認(rèn)識(shí)加深,云計(jì)算的市場(chǎng)也在不斷擴(kuò)大。在新基建中,「數(shù)據(jù)中心」對(duì)應(yīng)的便是云計(jì)算,云計(jì)算是數(shù)字化轉(zhuǎn)型的基礎(chǔ)。同時(shí),隨著「雙碳」規(guī)劃的推進(jìn),碳排放指標(biāo)也將成為自建超算中心發(fā)展的限制因素之一。而北京超級(jí)云計(jì)算中心在分布位置上的先見(jiàn)之明,無(wú)疑將在未來(lái)的逐鹿上優(yōu)勢(shì)漸顯。

作為國(guó)內(nèi)第一家成規(guī)模的、市場(chǎng)化運(yùn)營(yíng)的超算中心,北京超級(jí)云計(jì)算中心的建設(shè)模式,啟示了中國(guó)超算市場(chǎng)的發(fā)展現(xiàn)狀:除了國(guó)家超算中心,越來(lái)越多由地方政府支持、市場(chǎng)化資本創(chuàng)辦的超算中心展示了其在推進(jìn)中國(guó)超算發(fā)展上的獨(dú)特優(yōu)勢(shì)。

比如,在 2020 年中國(guó)高性能計(jì)算機(jī) TOP100 的榜單排名上,除了北京超級(jí)云計(jì)算中心 A 分區(qū)獲得佳績(jī),內(nèi)蒙古和林格爾新區(qū)的內(nèi)蒙古高性能計(jì)算公共服務(wù)平臺(tái)(青城之光)位居第四。

除了尖端超算與通用超算,中國(guó)的超算市場(chǎng)還有一股重要的力量:公有云廠商,比如阿里云、華為云與亞馬遜云(AWS)。北京超級(jí)云計(jì)算中心的另一塊重要業(yè)務(wù)——行業(yè)超算,便與這股力量有所交織與重疊。

行業(yè)超算更注重實(shí)際業(yè)務(wù),應(yīng)用規(guī)模為單核到幾千核不等,超算只是業(yè)務(wù)中的一環(huán)。比方說(shuō),在基因測(cè)序的過(guò)程中,基因測(cè)序儀產(chǎn)生大量數(shù)據(jù),這時(shí)候,如果數(shù)據(jù)存儲(chǔ)在云上,使用云的存儲(chǔ)、網(wǎng)絡(luò)與計(jì)算資源等等服務(wù)進(jìn)行基因的測(cè)序與分析,那么整個(gè)業(yè)務(wù)流程就會(huì)十分流暢。

對(duì)于這類業(yè)務(wù)流程,郭宇認(rèn)為,單靠通用超算是很難滿足的。從北京超級(jí)云計(jì)算中心的角度來(lái)看,他們會(huì)考慮將通用超算與云廠商的云服務(wù)資源相結(jié)合。除了核心的計(jì)算業(yè)務(wù),公有云廠商還提供豐富的云服務(wù)組件,能更好地解決用戶的問(wèn)題。

「對(duì)用戶來(lái)說(shuō),解決問(wèn)題最重要。至于計(jì)算資源來(lái)自哪里,他們并不在乎。我們就是要把各種優(yōu)勢(shì)的資源組合在一起,滿足客戶的需求?!构钫劦馈?/p>

從 2018 年至今,北京超級(jí)云計(jì)算中心已服務(wù)超過(guò) 15 萬(wàn)用戶, 已實(shí)現(xiàn)連續(xù)盈利。

比如,北京超級(jí)云計(jì)算中心曾支持中科院力學(xué)所研究中速磁浮列車的空氣動(dòng)力學(xué)外形優(yōu)化設(shè)計(jì)。中速磁浮列車氣動(dòng)外形優(yōu)化研究需要針對(duì)一系列優(yōu)化外形進(jìn)行數(shù)值模擬研究,對(duì)計(jì)算資源的要求較高,單工況網(wǎng)格量約 6000 萬(wàn)左右,流場(chǎng)特性研究及外形優(yōu)化研究中產(chǎn)生的計(jì)算工況上百計(jì)。

在這個(gè)項(xiàng)目中,北京超級(jí)云計(jì)算中心提供了可靈活拓展的大量計(jì)算節(jié)點(diǎn),保證了多任務(wù)的提交計(jì)算。最終,他們確定的最優(yōu)化流線外形,相對(duì)于原始外形,頭車氣動(dòng)升力系數(shù)增加了 33.25%,尾車氣動(dòng)升力系數(shù)減少了 1.78%,整車氣動(dòng)阻力系數(shù)減小了 4.44%,大幅提升了中速磁浮列車的氣動(dòng)性能。

「從用戶的角度看,建設(shè)幾千核的計(jì)算資源,先不說(shuō)時(shí)間,就投資成本來(lái)講,現(xiàn)在的主流服務(wù)器,一個(gè)節(jié)點(diǎn)大概是 40 核心,如果他用的是 5000 核的計(jì)算資源,那么就需要 125 個(gè)節(jié)點(diǎn),125 個(gè)節(jié)點(diǎn)大概需要投資1200多萬(wàn),但他們的項(xiàng)目時(shí)長(zhǎng)只有兩個(gè)月。」郭宇介紹。

因此,從投入產(chǎn)出比來(lái)看,對(duì)一些短期的項(xiàng)目來(lái)說(shuō),直接采購(gòu)計(jì)算資源顯然更劃算。

5

計(jì)算緊跟時(shí)代

在郭宇看來(lái),目前國(guó)內(nèi)的超算市場(chǎng)展示了以下三個(gè)趨勢(shì):

趨勢(shì)一:國(guó)內(nèi)的企業(yè)越發(fā)重視自主研發(fā),計(jì)算需求增加,同時(shí)也越來(lái)越愿意接受云計(jì)算的模式。

趨勢(shì)二:國(guó)產(chǎn)化的推進(jìn)加深。在超算體系中,芯片、操作系統(tǒng)、應(yīng)用等等方面的國(guó)產(chǎn)化趨勢(shì)將越來(lái)越明顯。

趨勢(shì)三:計(jì)算體系架構(gòu)正在革新。隨著人工智能、加速計(jì)算的興起,以異構(gòu)計(jì)算、加速卡為引導(dǎo)的 GPU 力量正在崛起。

郭宇談起,他在 2019 年去美國(guó)參加全球超級(jí)計(jì)算大會(huì)(SC19)時(shí),席間與美國(guó)高校的老師聊天,得到的訊息便是:「在現(xiàn)在的環(huán)境下,如果你沒(méi)有搞點(diǎn) GPU 的加速計(jì)算,文章都難發(fā)。從學(xué)術(shù)的角度看,CPU 體系已經(jīng)研究地差不多,下一個(gè)重點(diǎn)就是 GPU?!?/p>

2021 年正好是北京超級(jí)云計(jì)算中心成立的十周年。作為一家商業(yè)化運(yùn)營(yíng)的超算中心,郭宇介紹:「我們肯定會(huì)堅(jiān)定不移地走超算商業(yè)化的道路。與此同時(shí),他們也會(huì)與時(shí)俱進(jìn),根據(jù)國(guó)內(nèi)超算市場(chǎng)的發(fā)展趨勢(shì),制定新的發(fā)展方針。

緊跟學(xué)術(shù)界的研究趨勢(shì),北京超級(jí)云計(jì)算中心也加大了在 GPU 計(jì)算領(lǐng)域的投入,建設(shè)基于 GPU 加速卡的計(jì)算分區(qū)。隨著人工智能計(jì)算的興起,以及異構(gòu)計(jì)算模式的變化,他們也順勢(shì)建立了「AI智算云」,以滿足部分從事人工智能研究學(xué)者的需求。

相應(yīng)地,針對(duì)企業(yè)的自主研發(fā)需求,北京超級(jí)云計(jì)算中心也逐步推出了一系列面向企業(yè)的計(jì)算資源,比如針對(duì) CAD 三維設(shè)計(jì)和中小規(guī)模 CAE 仿真計(jì)算的設(shè)計(jì)仿真云,支持海量中小企業(yè)實(shí)現(xiàn) " 云上研發(fā) ",可以極低成本起步,推動(dòng)中小企業(yè)高速發(fā)展,為國(guó)家中小企業(yè)發(fā)展打造堅(jiān)實(shí)云上研發(fā)平臺(tái)。針對(duì)超算體系國(guó)產(chǎn)化的趨勢(shì),他們也有了基于國(guó)產(chǎn)芯片的集群,與國(guó)產(chǎn)軟件廠商合作,通過(guò)云化的方式,幫助國(guó)產(chǎn)應(yīng)用更好地觸及用戶。

在郭宇看來(lái),「讓計(jì)算不排隊(duì)」不僅是一句口號(hào),更是切實(shí)、堅(jiān)定的實(shí)踐。

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
中國(guó)云計(jì)算
云計(jì)算

相關(guān)文章

  • 選擇云服務(wù)需要考慮哪些因素?

    作為云計(jì)算技術(shù)落地的重要基礎(chǔ)設(shè)施成果,云服務(wù)器近年來(lái)獲得的飛速發(fā)展有目共睹。云服務(wù)器需求量的激增引發(fā)行業(yè)競(jìng)爭(zhēng)的加劇,甚至很多服務(wù)商將VPS更名為云服務(wù)器混淆視聽(tīng),濫竽充數(shù)。為保證我們互聯(lián)網(wǎng)服務(wù)的正常創(chuàng)建和運(yùn)行,優(yōu)質(zhì)的云服務(wù)器是基礎(chǔ)保障,那么選擇云服務(wù)器要考慮哪些因素呢?一、你的網(wǎng)站目標(biāo)群體你的網(wǎng)站目

  • 2022年中國(guó)云市場(chǎng)份額:阿里云騰訊云下降

    4月23日,IDC發(fā)布《中國(guó)公有云服務(wù)市場(chǎng)(2022下半年)跟蹤》,占據(jù)前四的分別為阿里云(40.6%)、華為云(11.0%)、騰訊云(11.0%)、中國(guó)電信(8.7%)。

  • 什么是云計(jì)算

    云計(jì)算是一種基于互聯(lián)網(wǎng)的計(jì)算模式,它允許用戶通過(guò)互聯(lián)網(wǎng)訪問(wèn)可擴(kuò)展的計(jì)算資源,而無(wú)需直接控制這些資源。云計(jì)算的出現(xiàn)改變了傳統(tǒng)計(jì)算模式的局面,為用戶提供了更加靈活、高效和可靠的計(jì)算環(huán)境。云計(jì)算的基本原理是將計(jì)算資源集中在一個(gè)中央服務(wù)器上,并通過(guò)互聯(lián)網(wǎng)向用戶提供計(jì)算服務(wù)。這樣,用戶就可以通過(guò)互聯(lián)網(wǎng)訪問(wèn)計(jì)算

  • 哪些行業(yè)適合選擇云服務(wù)器

    云服務(wù)器已經(jīng)成為數(shù)據(jù)存儲(chǔ)和備份的一種主流方式,對(duì)于許多需要存儲(chǔ)、保護(hù)和管理數(shù)據(jù)的企業(yè)和行業(yè)來(lái)說(shuō),它是個(gè)不錯(cuò)的選擇。無(wú)論您是任何行業(yè)的企業(yè),都可以通過(guò)云服務(wù)器實(shí)現(xiàn)在數(shù)據(jù)存儲(chǔ)和災(zāi)難恢復(fù)方面的優(yōu)化和成本的降低。

  • 租用云服務(wù)器的好處

    云服務(wù)器不僅可以提供可靠、高效和安全的解決方案,同時(shí)還可以節(jié)約成本、節(jié)省時(shí)間和精力,并且提供更好的靈活性來(lái)幫助用戶適應(yīng)其業(yè)務(wù)需求的變化。

熱門排行

信息推薦