數據作為數字經濟時代最核心、具價值的生產要素,其高速發(fā)展使其成為全球最為重要的經濟發(fā)展引擎之一。數據顯著改變了當代社會的生產、生活模式,因此,對數據價值的研究受到諸多關注,如何使數據“存得下、流得動、用得好”亟需破局。在算網融合背景下,已有諸多針對算力網絡的研究,如云、邊、端及其之間的最優(yōu)化分配與調度,以及存儲資源網絡資源在算力網絡中的應用等。算力網絡本質上是一種算力資源服務,即根據計算任務的時間和業(yè)務類型需求將包含計算、存儲和網絡在內的算力資源靈活調度到合適的地方。
目前,產業(yè)界在算力網絡方面已進行了多項探索。
在運營商方面,中國聯合網絡通信有限公司網絡技術研究院與華為技術有限公司聯合發(fā)布《中國聯通算力網絡白皮書》,分析了算力網絡的概念、架構、標準和產業(yè)生態(tài);中國移動通信集團有限公司與華為技術有限公司聯合發(fā)布了《算力感知網絡技術白皮書》,對算力感知網絡分布式系統(tǒng)模式進行了系統(tǒng)闡述;中國電信集團有限公司發(fā)布的《云網融合2030技術白皮書》提出需明確算力網絡作為在云網一體階段的關鍵地位。
在標準化方面,中國通信學會、中國通信標準化協會、網絡5.0產業(yè)和技術創(chuàng)新聯盟等組織和產業(yè)聯盟已啟動了算力網絡相關標準的制定,在技術、協議、管理和度量方面都有很多成果。在學術研究方面,《面向計算網絡融合的下一代網絡架構》《面向6G需求的算力網絡技術》《基于計算、存儲、傳送資源融合化的新型網絡虛擬化架構》等也針對業(yè)務需求多樣特征提出了算力資源泛在化、網絡服務智能化發(fā)展的技術趨勢。
通過對算網融合的研究,業(yè)界逐漸發(fā)現只有深度整合計算、存儲、網絡和軟件資源,加快數據共享和融合,才能更好地支撐計算,進而充分挖掘數據價值。算存運一體是指算力、存力和運力的一體化協同發(fā)展。為充分釋放數據要素價值,支撐數字業(yè)務計算處理需求,需推進算存運一體化協同發(fā)展。為推動我國數據產業(yè)鏈的采集、存儲、傳輸、交易和服務各環(huán)節(jié)高效可靠發(fā)展,筆者對我國數據中心存力情況進行了分析,并結合實際情況提出了如何增強數據中心存力水平,保證數據中心高效運行的建議。
全球數據存儲產業(yè)現狀分析
政策分析
在政策層面,世界主要國家和地區(qū)為保障數據存儲產業(yè)的蓬勃發(fā)展,打造數字經濟供給側的競爭力,更好地服務經濟、社會,出臺了各項政策。如表1所示,近年來世界主要國家和地區(qū)積極發(fā)布政策推動以半導體為代表的新材料技術發(fā)展。固態(tài)硬盤是半導體存儲產品的重要形態(tài),世界主要國家和地區(qū)均通過政策鼓勵大力推動半導體產業(yè)發(fā)展。2021年,美國先后發(fā)布《美國就業(yè)計劃》《無盡前沿法案》,投入上千億美元支持和發(fā)展包括半導體、先進計算、先進計算機軟硬件、數據存儲、數據管理等在內的關鍵技術與未來產業(yè)。除了政策支持外,美國的行業(yè)協會也積極通過商業(yè)形式加強了存儲產品的測試和認證,如美國存儲性能委員會推出了存儲設備測試規(guī)范。
表1 世界主要國家和地區(qū)數據存儲行業(yè)相關政策
2021年6月,日本發(fā)布了《半導體數字產業(yè)戰(zhàn)略》以擴大國內半導體生產能力,針對半導體、數字基礎設施、數字產業(yè)做了全面系統(tǒng)的部署。2021年年底,日本發(fā)布《半導體產業(yè)緊急強化方案》,吸引廠商新建半導體工廠,同時為老舊半導體廠房設備提供資金支持,致力于提高日本半導體企業(yè)的營收。
1994年,韓國推出了《半導體芯片保護法》,此后又通過各項計劃諸如“21世紀智慧韓國工程”(Brain Korea 21 Program for Leading Universities & Students,BK21)及“21世紀智慧韓國工程后續(xù)項目”(Brain Korea 21 Program for Leading Universities & Students Plus,BK21+)等對相關科研院所及專業(yè)進行了精準、專項支援,并在2016年積極推出了“半導體希望基金”,以半導體相關企業(yè)為載體,力求推進存儲方面新技術的開發(fā)與突破。2021年5月,韓國政府正式公布“K-半導體戰(zhàn)略”,計劃構建集半導體設計、原材料、零部件、尖端設備等在內的生產體系,旨在推動全球半導體供應鏈加速發(fā)展。
歐洲以法國電信、施耐德,德國思愛普為代表的企業(yè)積極投資數據存儲與管理產業(yè),重點發(fā)展大數據通信及其他公共服務、大數據的數據中心綠色節(jié)能應用、實時數據計算等方向。
我國也為存儲行業(yè)的健康發(fā)展出臺了一系列政策,諸如《“十四五”信息通信行業(yè)發(fā)展規(guī)劃》《全國一體化大數據中心協同創(chuàng)新體系算力樞紐實施方案》《新型數據中心發(fā)展三年行動計劃(2021—2023年)》等,旨在強化數據中心、云算力的統(tǒng)籌和數據資源的流通治理。
市場分析
工業(yè)互聯網、人工智能等新興技術帶來了海量數據,相關業(yè)務的可靠穩(wěn)定應用離不開數據存儲,經濟、社會運作中產生的各類數據與物理世界完成交互后,最終處理的結果又會回到數據存儲處進行保存,數據處理結果將進一步助力模型、算法的精確性和可用性提升,從而服務數據分析。
數據量暴增、業(yè)務場景呈多樣化等使數據存儲面臨一定挑戰(zhàn),為應對數據存儲挑戰(zhàn),可選擇不同類型的數據存儲設備?,F代數據存儲根據存儲介質的不同,主要分為光學存儲(CD、DVD、藍光存儲)、磁性存儲(磁帶、軟盤、機械硬盤)和半導體存儲三類。光學存儲設備擁有長壽命、安全可靠和低成本等優(yōu)點,主要適用于冷數據存儲,適合歸檔類數據的長期備份使用,但光學存儲技術在存儲容量、存儲密度及存取速率等方面都受限制,且存儲的信息極易受摩擦等外部作用而損壞。磁性存儲接受度較高,主要用來對關鍵數據做備份歸檔以及冷數據的長期保存。其中存儲軟盤存取速度慢,容量較小,但可裝可卸、攜帶方便,適用于需要被物理移動的小文件。機械硬盤以其較低的價格以及更高的存儲容量占據了一定市場份額,但存在存儲時間不長、能耗高、存儲密度不大等問題。近年來,以半導體為代表的新一代全閃存技術飛速發(fā)展,半導體閃存是新一代存儲介質,由于具有斷電不丟失數據、高性能快速讀取、大容量、綠色節(jié)能等特點,被各行各業(yè)的信息系統(tǒng)大量應用,已逐步成為存儲產業(yè)的主要媒介。在全球半導體市場中,存儲器占據了約1/3的規(guī)模,是半導體大的細分市場之一,正在成為業(yè)界主流的存儲器。
以美國企業(yè)為代表的一批企業(yè)憑借傳統(tǒng)計算機與互聯網技術優(yōu)勢以及軟硬件核心技術基礎占據了存儲產業(yè)鏈前端,通過并購、整合、吸收,先后推出各種數據存儲軟硬件服務,在全球數據存儲的市場份額中,美國企業(yè)處于壟斷地位。目前,我國已有部分企業(yè)也占據了一定市場份額。Gartner在2021年發(fā)布了存儲相關的魔力象限報告,華為技術有限公司進入了主存儲的領導者象限;2022年,在Gartner公布的全球主存儲魔力象限報告中,浪潮軟件科技有限公司存儲位居挑戰(zhàn)者象限,其愿景前瞻性和執(zhí)行能力穩(wěn)步提升。
我國數據中心存力情況分析
發(fā)展環(huán)境分析
區(qū)域數據中心存力水平與經濟發(fā)展水平緊密相關,經濟規(guī)模越大,數據資源就會越豐富,對數據存儲的需求量也越大。我國東部地區(qū)經濟相對發(fā)達,數字經濟規(guī)模較大,根據《中國綜合算力指數(2022年)》,東部地區(qū)數據存力規(guī)模相對較高,也是全國數據中心建設和運營的主要區(qū)域,因此東部地區(qū)數據中心存力水平相對較高[3]。其中北京、上海、廣東及周邊地區(qū)數據計算需求較多,尤其是對時效性要求較高的熱數據處理,在數據計算和存儲時追求卓越的存取和讀寫速度,對數據存力水平提出了挑戰(zhàn),故需求驅動了這些地區(qū)的數據存力技術創(chuàng)新和水平提升。
數據存儲容量分析
在數據存儲容量方面,數據存儲總體容量集中度高。產生數據的地區(qū)較集中,對數據處理需求高的地區(qū)占據了全國大多數存儲容量,根據《中國存力白皮書(2022年)》,僅廣東、江蘇、上海、北京、河北、浙江、貴州7個省市的總體數據存儲容量就超過了全國總容量的一半;北京、上海、廣州3個城市的總體數據存儲容量就占了總容量的30%。
在單機架存力方面,全國各區(qū)域單機架存力水平相差較大,雖然大多數地區(qū)的單機架存力為120 TB~180 TB,部分地區(qū)如廣西和西藏,單機架存力僅為100 TB,而廣東、北京、浙江和江蘇的單機架存力則超過150 TB。實施“東數西算”工程可加快推動數據中心向西大規(guī)模布局,率先轉移后臺加工、離線分析、存儲備份等對網絡要求不高的業(yè)務,預計八大樞紐節(jié)點數據存力將繼續(xù)擴大規(guī)模。為提高數據中心標準機架的效率,為算力提供更好的數據支撐,未來需更加關注數據中心單機架的數據存儲容量。
2022年,全國各地區(qū)的數據存儲容量排名順序基本不變,受元宇宙、ChatGPT等新興技術的發(fā)展,各地區(qū)存儲容量穩(wěn)步增長。同時,受“東數西算”工程影響,我國各大一線城市紛紛在西部地區(qū)部署數據存儲應用,推動了當地數字經濟以及信息化產業(yè)的發(fā)展,如貴州、新疆、內蒙古、甘肅和陜西等。這些大數據產業(yè)蓬勃發(fā)展的地區(qū),充分發(fā)揮本地大數據資源價值,促進數據中心產業(yè)迅速發(fā)展。受政策牽引和自身資源稟賦的影響,這些地區(qū)數據存力水平將不斷提高,但同時也不能忽視部分中西部地區(qū)網絡帶寬小、跨省數據傳輸費用高、算力需求有限等情況。
創(chuàng)新能力分析
對創(chuàng)新能力的分析主要是通過對存儲專利數量進行分析。截至2022年,筆者通過在Inspiro知識產權數據庫檢索關鍵詞“存儲”發(fā)現,我國東部地區(qū)具創(chuàng)新活力,其中廣東在存儲專利申請數量上位列第一,北京、上海、江蘇等地次之,湖北、山東和四川等地依托于當地存儲企業(yè)優(yōu)勢,也在存儲專利申請上有一定優(yōu)勢。
發(fā)展趨勢分析
《中華人民共和國數據安全法》已經發(fā)布并施行,保護數據安全成為數據存儲發(fā)展的關鍵,可靠數據中心存力的建設將會加速,以應對數據安全風險和數字經濟時代的挑戰(zhàn)。數據中心行業(yè)普遍存在“有備份、無容災”“缺乏異地災備”的現象。金融、電信運營商等行業(yè)災備應用程度高,災備體系建設相對完善,金融行業(yè)數據備份建設比例達到約92%,但其異地備份的比例僅約10%,業(yè)務系統(tǒng)容災比例不到40%,異地容災的比例低于30%。
為保證數據存儲安全,云存儲方式通過將存儲設備和應用軟件相結合成為數據存儲的發(fā)展趨勢之一,實現由設備到服務的科技升級,提供靈活的彈性伸縮、彈性存儲容量、安全可靠、高可用等能力。隨著云計算服務模式的不斷發(fā)展,其成本高、容量需求大、寬帶需求高的問題也亟需解決,在這種背景下,云存儲的出現則完美解決了這一問題,不僅突破了傳統(tǒng)存儲區(qū)域網絡(Storage Area Network,SAN)的性能問題,而且實現了性能與容量的線性擴展。云存儲具有容易擴容、更易于管理、成本更低廉、數據更安全、服務不中斷等高效集群優(yōu)勢,但還存在一些瓶頸需攻關突破,如云存儲系統(tǒng)安全性、便攜性及數據訪問等。
綠色低碳始終是數據存儲設備需要關注的問題。在介質層面,介質節(jié)能是利用半導體存儲代替磁介質存儲,硅進磁退方式節(jié)約能耗。當前已經逐漸從混合硬盤的磁盤介質演進到固態(tài)硬盤的半導體存儲介質。在架構層面,存算分離架構結合數據高密存儲及糾刪碼技術,也減少了同等容量下存儲的能源消耗。在算法層面,數據重刪壓縮技術可使相同空間存儲更多的數據從而實現節(jié)能,并能夠實現桌面云、虛擬機、數據庫等業(yè)務場景2~3.6倍的數據縮減率,耗能大幅度節(jié)約。
我國數據中心存力高質量發(fā)展建議
數據存儲是發(fā)展數字經濟的重要一環(huán)。我國數據存儲產業(yè)起步較晚,大多數企業(yè)的優(yōu)勢主要體現在硬件設備和系統(tǒng)軟件上。此外,承載數據的關鍵數據基礎設施如存儲器、數據網絡等還在可靠性、安全性、可持續(xù)供應性等方面存在問題。
為推動數據中心存力高質量發(fā)展,首先要提高對存儲關鍵性的重視程度。盡快研究形成數據存儲產業(yè)發(fā)展的系列政策、辦法,提升我國在數據存儲領域的競爭力,具體建議包括以下幾方面。
在技術方面,一是加快部署下一代數據存儲技術,推動數據存儲核心技術底層研發(fā)和技術攻關,提升存儲介質、安全設計、數據防護、安全評測等關鍵技術水平,打造全球存儲的創(chuàng)新高地;二是進一步打造科學的人才培養(yǎng)體系,多層次、多領域、全方位地發(fā)掘人才、培養(yǎng)人才,著重培養(yǎng)兼具專業(yè)理論與行業(yè)知識的復合型人才,鼓勵地方政府引導企業(yè)完善人才激勵機制,引進和留住高端存儲專業(yè)人才,優(yōu)化人才布局;三是要集中資源完成科技攻關,推動科研成果轉化為實用型產品,不斷推進并深化生產單位和科研院所聯合攻關,從實際出發(fā)解決科學問題;四是發(fā)揮我國制度優(yōu)勢,集中力量解決產業(yè)核心問題,不斷加大資金投入以助力技術攻關,同時細化用戶類型,開發(fā)差異化產品,滿足不同受眾需求以從容應對不同場景。
在標準方面,我國應盡快建立數據存儲行業(yè)規(guī)范和標準,完善數據存儲、數據保護、安全評測、數據災備等關鍵標準體系。一方面,鼓勵國內相關企業(yè)及研究機構進行標準和評估體系研究,鼓勵行業(yè)龍頭企業(yè)通過硬件開放、軟件開源、使能伙伴等策略,給予其他合作伙伴尤其是創(chuàng)新型小微企業(yè)充分的政策支持與資源傾斜,群策群力,共同完成半導體存儲行業(yè)標準的制定;另一方面,持續(xù)加強數據存儲產業(yè)國際交流與合作,加強與國際標準組織的合作,加速我國技術標準的國際化進程。
在產業(yè)方面,一是構建先進的存儲應用生態(tài),促進數據存儲產業(yè)相關供應商融合;二是提升產業(yè)鏈安全保障能力,構建產業(yè)集群梯次化發(fā)展體系;三是針對金融、醫(yī)療、教育等重點行業(yè),打造示范應用項目,如在安全可靠性方面,政府示范先行,推動政務云、國家一體化大數據中心、行業(yè)大數據中心、智慧城市等場景的災備體系建設,在全國范圍內重點打造一批數據災備的示范基地、示范項目,實現標準和政策落地,引領千行百業(yè),迅速化解數據安全風險。
結束語
通過對我國數據中心存力發(fā)展的研究,可以發(fā)現,數據中心存力水平與經濟發(fā)展水平緊密相關,總體而言,經濟規(guī)模越大,數據中心存力水平越高;我國的數據存儲總體容量集中度高,對數據處理需求高的地區(qū)占據了全國大多數存儲容量,其他地區(qū)的存儲容量還有較大提升空間。為提高數據中心標準機架的效率,未來需更加關注數據中心單機架的存儲容量,確保數據“算得快、存得好、傳得穩(wěn)”。