7月30日,在2022中國算力大會主論壇上,中國工程院院士鄔賀銓詳細(xì)闡述了對數(shù)據(jù)中心“數(shù)學(xué)”與“算術(shù)”的思考。他解釋道,“數(shù)學(xué)”指的是研究數(shù)據(jù)的科學(xué),“算術(shù)”是研究算力的技術(shù)。
在以算為主還是以存為主方面,鄔賀銓表示,人工智能驅(qū)動算力需求快速增長,基于GPU等構(gòu)建的人工智能智算中心適于訓(xùn)練數(shù)據(jù)導(dǎo)出模型,訓(xùn)練出數(shù)學(xué)模型后,深度神經(jīng)網(wǎng)絡(luò)并不需要調(diào)度非常多的參數(shù),降低了對算力的需求,基于CPU的通用算力的IDC適用于在已知數(shù)學(xué)模型下的計算任務(wù)。因此他表示,人工智能智算中心主要任務(wù)是算,IDC互聯(lián)網(wǎng)數(shù)據(jù)中心主要任務(wù)是存。
在三類算力比例方面,鄔賀銓表示,在基礎(chǔ)算力、智能算力和超算三個算力里,美國分別占全球35%、15%、30%,而中國分別占27%、26%和20%,美國是基礎(chǔ)算力為主,中國智能算力的能力遠(yuǎn)超美國。中國的超算和智能算力基本以政府為主建設(shè),基礎(chǔ)算力以運營商和互聯(lián)網(wǎng)企業(yè)為主。
在冷數(shù)據(jù)與熱數(shù)據(jù)方面,鄔賀銓表示,數(shù)據(jù)從大的方面分為冷數(shù)據(jù)和熱數(shù)據(jù),熱數(shù)據(jù)主要指需要實時計算的數(shù)據(jù),相比之下冷數(shù)據(jù)的計算需求非常態(tài)化。東西部分別適合處理熱和冷數(shù)據(jù),東數(shù)西算實際是東數(shù)西存。
在存算分離與存內(nèi)計算方面,鄔賀銓表示,存算分離可采用開放存儲體系和磁帶存儲介質(zhì),存儲器可同時服務(wù)多個服務(wù)器,池化存儲支持多云,提高利用率,降低成本能耗,可用于對冷數(shù)據(jù)處理;存內(nèi)計算適于對熱數(shù)據(jù)處理,例如自動駕駛可以在車內(nèi)同時完成存與算。
在封閉系統(tǒng)與開放系統(tǒng)存儲方面,鄔賀銓表示,開放系統(tǒng)存儲實現(xiàn)存算分離,存儲容量為多服務(wù)器共享,以池化方式支持多云應(yīng)用。不同存儲架構(gòu)適應(yīng)不同任務(wù),可按照任務(wù)來軟件定義存儲。
在PUE與IT能效方面,鄔賀銓表示,在IDC的IT系統(tǒng)能耗中,服務(wù)器約占到50%,存儲系統(tǒng)占35%,網(wǎng)絡(luò)通信設(shè)備占15%,大部分電能是用于維持服務(wù)器的狀態(tài),只有6%~12%用于計算。因此他建議,要減低能耗,對冷數(shù)據(jù)處理建議用磁帶代替磁盤,100PB存儲成本10年可下降73%;對熱數(shù)據(jù)用閃存代替磁盤,但目前成本比較高。另外,還有通過數(shù)據(jù)預(yù)處理改進(jìn)能效,去????一些無效值、空格和缺失的及果實的數(shù)據(jù)。
在數(shù)據(jù)可信性與災(zāi)備保護(hù)方面,鄔賀銓表示,災(zāi)備是數(shù)據(jù)中心剛性需求,美國數(shù)據(jù)保護(hù)占存儲投資1/3,全球平均是27.4%,而中國僅7.8%,尤其異地備份的比例更低,所以災(zāi)備的能力是不足的,所以這點上我們還是要改進(jìn),同時,究竟是備份數(shù)據(jù)還是備份算力,這是值得研究的問題。
此外,在談到東數(shù)西算時,鄔賀銓表示,東數(shù)西算使算力設(shè)施的布局超越了數(shù)據(jù)中心樞紐的范疇,東部與西部互為冷熱數(shù)據(jù)的配對方面,要有合適的比例。同時,同一數(shù)據(jù)中心樞紐或集群內(nèi)部也有很多比例需要優(yōu)化。
“關(guān)于數(shù)據(jù)中心的‘?dāng)?shù)學(xué)’和‘算術(shù)’,還有很多需要深入研究的內(nèi)容,我們要善于從實踐中學(xué)習(xí)創(chuàng)新?!编w賀銓最后表示。