本文原載微信公眾號(hào)"云數(shù)智觀察",作者:郭濤。轉(zhuǎn)載已獲授權(quán)。
北京2026年5月13日 /美通社/ -- AI時(shí)代,在算力火了之后,人們又將關(guān)注的目光投向了存儲(chǔ)。雖然算力決定了AI的上限,但存儲(chǔ)決定了AI能不能真正落地,并且用得好、用得久、用得起。
存儲(chǔ)漲價(jià)的背后
近期,存儲(chǔ)產(chǎn)品漲價(jià)潮持續(xù)蔓延,包括DRAM、閃存顆粒、機(jī)械硬盤、磁帶等核心組件的供應(yīng)全面緊張,特別是20TB、24TB大容量硬盤的交付周期普遍延長(zhǎng)。IBM大中華區(qū)存儲(chǔ)事業(yè)部總經(jīng)理吳磊提到一現(xiàn)象,當(dāng)前很多企業(yè)即便有充足的預(yù)算,存儲(chǔ)產(chǎn)品也很難快速到貨。這態(tài)勢(shì)與GPU"一卡難求"的緊缺局面高度相似,顯示出供需矛盾全面加劇,全球供應(yīng)鏈與成本壓力倍增。
其實(shí),存儲(chǔ)供應(yīng)鏈?zhǔn)Ш庵皇歉〕龊C娴谋揭唤恰?chuàng)新技術(shù)的快速迭代、層出不窮的新型工作負(fù)載,以及企業(yè)用戶對(duì)安全和自動(dòng)化運(yùn)維的高要求等,才是最大的壓力所在。
從業(yè)務(wù)需求的轉(zhuǎn)變可以看出,當(dāng)AI從模型訓(xùn)練階段全面進(jìn)入推理的爆發(fā)期,企業(yè)的存儲(chǔ)需求發(fā)生了根本性改變。AI推理必然依賴企業(yè)內(nèi)部的海量、多類型、實(shí)時(shí)性存量數(shù)據(jù),而數(shù)據(jù)不可復(fù)用、難以盤活成了普遍痛點(diǎn)。另外,隨著大模型的快速迭代,參數(shù)量激增,對(duì)存儲(chǔ)的響應(yīng)速度、并發(fā)能力、數(shù)據(jù)流動(dòng)性等都提出了更高要求。
再?gòu)钠髽I(yè)日常的安全與運(yùn)維實(shí)踐來看,技術(shù)架構(gòu)復(fù)雜、攻擊升級(jí)、專業(yè)人才不足等短板進(jìn)一步被放大。在安全層面,黑客利用AI技術(shù),使得索軟件的攻擊速度與破壞力大幅提升。傳統(tǒng)安全響應(yīng)機(jī)制幾乎失效,必須實(shí)現(xiàn)秒級(jí)甚至毫秒級(jí)的威脅發(fā)現(xiàn)、偵測(cè)與處置,否則企業(yè)將面臨巨大的數(shù)據(jù)損失。在運(yùn)維層面,企業(yè)已經(jīng)普遍采用"混合多云+多廠商設(shè)備"的異構(gòu)架構(gòu),這抬高了運(yùn)維團(tuán)隊(duì)的人力成本和技術(shù)門檻。
不容忽視的是,企業(yè)的數(shù)據(jù)規(guī)模長(zhǎng)期處于加速爆發(fā)的過程中,從數(shù)百TB躍升至數(shù)十EB,而且結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)混雜,覆蓋IoT設(shè)備、智能汽車、醫(yī)療影像、工業(yè)傳感器等多元數(shù)據(jù)源,同時(shí)金融、醫(yī)療、政務(wù)、汽車等行業(yè)又有嚴(yán)格的合規(guī)要求,長(zhǎng)期數(shù)據(jù)保留增加了存儲(chǔ)的難度與成本。
一方面,數(shù)據(jù)必須服務(wù)于業(yè)務(wù),將海量數(shù)據(jù)高效轉(zhuǎn)化為真實(shí)業(yè)務(wù)價(jià)值;另一方面,數(shù)據(jù)又需要長(zhǎng)期合規(guī)留存、全程安全可控。雙重壓力疊加,迫使企業(yè)必須尋求新的存儲(chǔ)技術(shù)、架構(gòu)與解決方案。
讓AI走向數(shù)據(jù)
吳磊指出,"讓AI走向數(shù)據(jù)"的核心存儲(chǔ)理念,直指?jìng)鹘y(tǒng)存儲(chǔ)模式的痛點(diǎn),將成為企業(yè)構(gòu)建AI競(jìng)爭(zhēng)力的關(guān)鍵。
過去,企業(yè)普遍采用"數(shù)據(jù)搬運(yùn)、多副本拷貝"的傳統(tǒng)方式,為滿足AI處理的需要,就要將數(shù)據(jù)復(fù)制、上傳、集中處理。這種方式在小規(guī)模數(shù)據(jù)時(shí)代尚能適用,但進(jìn)入EB級(jí)數(shù)據(jù)與高并發(fā)推理的"詞元(Token)經(jīng)濟(jì)"時(shí)代,則捉襟見肘。
從"數(shù)據(jù)走向 AI"到"讓AI走向數(shù)據(jù)",這是范式的轉(zhuǎn)變。吳磊解釋說,讓AI主動(dòng)走向數(shù)據(jù)、理解數(shù)據(jù)并就近處理數(shù)據(jù),將從根本上解決數(shù)據(jù)搬運(yùn)的難題。
傳統(tǒng)的多副本不僅會(huì)帶來高昂的網(wǎng)絡(luò)與存儲(chǔ)成本,還將引發(fā)數(shù)據(jù)一致性失控、安全管控難度劇增、合規(guī)追溯困難等一系列困擾,有些時(shí)候企業(yè)甚至無法判斷哪一份副本才是真實(shí)、最新的數(shù)據(jù),最終可能導(dǎo)致AI推理結(jié)果失真或算力大量空耗。
IBM的破解之道是,以"單副本架構(gòu)+內(nèi)容感知存儲(chǔ)(CAS)"為技術(shù)核心,讓存儲(chǔ)主動(dòng)感知數(shù)據(jù)變化,在數(shù)據(jù)更新的一瞬間即可同步給AI模型,無需人工重做副本,更無需重復(fù)數(shù)據(jù)處理,從而實(shí)現(xiàn)數(shù)據(jù)一處更新、全局可用。這一新的架構(gòu)大幅降低了數(shù)據(jù)傳輸與安全管控成本,可確保數(shù)據(jù)的唯一性、準(zhǔn)確性與實(shí)時(shí)性,很好地消除了數(shù)據(jù)亂、副本多、效率低的瓶頸。
在此基礎(chǔ)上,IBM還進(jìn)一步提出了"人工智能工廠"(AI Factory)的理念,致力于打造覆蓋數(shù)據(jù)采集、集成、準(zhǔn)備、訓(xùn)練、模型適配、推理、歸檔的端到端AI數(shù)據(jù)平臺(tái),讓數(shù)據(jù)在全生命周期內(nèi)自由流動(dòng),并持續(xù)產(chǎn)生價(jià)值。
吳磊用餐飲類比詞元經(jīng)濟(jì)時(shí)代存儲(chǔ)的演進(jìn)。傳統(tǒng)存儲(chǔ)如同家庭廚房,SAN/NAS好比預(yù)制加工廠,應(yīng)用存儲(chǔ)就像是預(yù)制餐;而新的"AI+"要求存儲(chǔ)變成"私人廚師",智能的存儲(chǔ)可以按需調(diào)度、主動(dòng)服務(wù)并實(shí)時(shí)響應(yīng)AI負(fù)載,并最大化數(shù)據(jù)價(jià)值。
總而言之,讓AI走向數(shù)據(jù),就是把存儲(chǔ)從被動(dòng)的"數(shù)據(jù)容器"升級(jí)為主動(dòng)的"智能數(shù)據(jù)服務(wù)層",讓AI可以在數(shù)據(jù)產(chǎn)生的地方就近處理、實(shí)時(shí)學(xué)習(xí)、高效推理,實(shí)現(xiàn)數(shù)據(jù)不搬家、AI更高效、成本更可控、安全可追溯,將AI從演示項(xiàng)目變成規(guī)模化的生產(chǎn)力,這將為AI的落地筑牢最堅(jiān)實(shí)的數(shù)字底座。
邁向自主存儲(chǔ),踐行增本增效
在"讓AI走向數(shù)據(jù)"的理念指導(dǎo)下,IBM布局新的存儲(chǔ)產(chǎn)品與技術(shù),為AI落地鋪就數(shù)據(jù)之橋。
1. 持續(xù)更新AI高性能存儲(chǔ),打造AI工廠的算力底座與數(shù)據(jù)引擎
作為IBM人工智能工廠的核心引擎,IBM Storage Scale System 6000/3500面向大模型訓(xùn)練、多模態(tài)數(shù)據(jù)處理、萬卡級(jí)GPU集群等高算力場(chǎng)景,提供端到端AI數(shù)據(jù)管道支撐。
具體來看,面向大模型訓(xùn)練的Checkpoint,可以提供極致高吞吐、低延遲架構(gòu),保障訓(xùn)練過程中關(guān)鍵斷點(diǎn)數(shù)據(jù)快速落盤、不丟進(jìn)度、不浪費(fèi)算力,顯著提升GPU有效利用率;可以統(tǒng)一承載文本、圖片、音頻、視頻、傳感器數(shù)據(jù)等混合負(fù)載,適配從數(shù)據(jù)準(zhǔn)備、分布式訓(xùn)練、模型適配到推理的全流程;全局統(tǒng)一命名空間能夠有效打通邊緣、數(shù)據(jù)中心、私有云與公有云,實(shí)現(xiàn)數(shù)據(jù)一處更新、全局可用;與NVIDIA實(shí)現(xiàn)深度生態(tài)協(xié)同,比如支持GPUDirect等高速協(xié)議,大幅降低數(shù)據(jù)搬運(yùn)開銷。
IBM Storage Ceph主要面向高IOPS、高并發(fā)、云原生的AI負(fù)載場(chǎng)景,可提供統(tǒng)一、彈性、可橫向擴(kuò)展的分布式存儲(chǔ)能力。它采用統(tǒng)一架構(gòu),塊、文件、對(duì)象三協(xié)議合一,可以簡(jiǎn)化云原生與虛擬化環(huán)境部署,并且兼容S3 API,很好地適配容器、微服務(wù)與AI云平臺(tái)。特別值得一提的是,它可以從小規(guī)模起步,按需平滑擴(kuò)容,尤其適合數(shù)據(jù)湖、AI中臺(tái)、海量小文件等長(zhǎng)期增長(zhǎng)型場(chǎng)景。
2. 引入AI智能體,重新定義新一代閃存核心
IBM重新定義企業(yè)級(jí)全閃存,將AI智能體與自研硬件芯片深度融合,打造自主、安全、高效的核心業(yè)務(wù)存儲(chǔ)。
全新的FlashSystem.ai是AI驅(qū)動(dòng)的自主存儲(chǔ)的智能中樞。它定位為"永不休息的智能存儲(chǔ)管理員",可以把存儲(chǔ)從被動(dòng)設(shè)備升級(jí)為自主自治的智能層。IBM中國(guó)區(qū)存儲(chǔ)業(yè)務(wù)銷售總經(jīng)理金鑫歸納了FlashSystem.ai的特色和優(yōu)勢(shì):第一,支持自然語言交互,降低命令行與專業(yè)門檻,即使普通管理員也可高效操作;第二,實(shí)現(xiàn)主動(dòng)性能優(yōu)化,比如在數(shù)小時(shí)內(nèi)自適應(yīng)業(yè)務(wù)負(fù)載,實(shí)現(xiàn)智能調(diào)優(yōu)資源、智能遷移負(fù)載,提升整體效率與穩(wěn)定性;第三,秒級(jí)勒索軟件感知,比如可通過I/O特征識(shí)別異常,并在60秒內(nèi)發(fā)出告警,同時(shí)結(jié)合硬件級(jí)防護(hù),實(shí)現(xiàn)更快的恢復(fù);第四,合規(guī)審計(jì)自動(dòng)化,可自動(dòng)生成可解釋審計(jì)報(bào)告,大幅縮短合規(guī)文檔編制時(shí)間,降低合規(guī)成本;第五,在安全方面,系統(tǒng)僅支持"增、擴(kuò)、優(yōu)化"等安全操作,同時(shí)嚴(yán)格限制刪除等高風(fēng)險(xiǎn)動(dòng)作,從機(jī)制上保障了數(shù)據(jù)安全;第六,管理效率大幅提升,可減少90%的存儲(chǔ)手動(dòng)管理工作量。
金鑫還特別提到了IBM自研的硬件級(jí)黑科技——第五代閃存核心模塊(FlashCore Module 5)。其重要性和特殊性表現(xiàn)在:可實(shí)現(xiàn)硬件級(jí)壓縮、重刪、加密和異常檢測(cè),完全不占用控制器性能,最高支持1:5的硬件壓縮/重刪,顯著降低單位TB的成本;采用量子安全加密,通過硬件級(jí)加密抵御未來量子計(jì)算破解風(fēng)險(xiǎn),有效滿足長(zhǎng)期數(shù)據(jù)安全與合規(guī)要求。目前第五代 FCM可支撐IBM FlashSystem 5600/7600/9600全系列產(chǎn)品,實(shí)現(xiàn)從邊緣到核心關(guān)鍵業(yè)務(wù)的全覆蓋。
以AI智能體為驅(qū)動(dòng),IBM FlashSystem.ai將訓(xùn)練好的AI模型封裝在本地容器中,用自然語言交互替代命令行與圖形界面,從而實(shí)現(xiàn)存儲(chǔ)的自助式管理、自動(dòng)化運(yùn)維、主動(dòng)式優(yōu)化,旨在用極少的人力管理大規(guī)模、跨品牌、跨時(shí)代的復(fù)雜存儲(chǔ)架構(gòu),以實(shí)現(xiàn)高效率、高韌性、低成本和強(qiáng)合規(guī),為業(yè)務(wù)創(chuàng)新保駕護(hù)航。
如果說AI存儲(chǔ)是AI時(shí)代存儲(chǔ)必修的"基本功",解決了算力與數(shù)據(jù)的匹配問題,那么IBM提出的"自主存儲(chǔ)"則是AI時(shí)代存儲(chǔ)的"進(jìn)階形態(tài)",解決的是企業(yè)對(duì)數(shù)據(jù)、架構(gòu)與運(yùn)維的自主掌控問題。兩者一脈相承、層層遞進(jìn),共同構(gòu)成IBM面向"AI+"時(shí)代的完整存儲(chǔ)戰(zhàn)略。AI存儲(chǔ)是能力層,自主存儲(chǔ)則是管理層/控制層,在AI存儲(chǔ)之上,用AI智能體實(shí)現(xiàn)自治、自愈、自優(yōu)化、自安全。自主存儲(chǔ)可以理解為是IBM"數(shù)字自主"戰(zhàn)略在存儲(chǔ)層的落地,其核心是讓企業(yè)掌握數(shù)據(jù)與架構(gòu)的絕對(duì)掌控權(quán),不被廠商、云所綁定,能夠自主規(guī)劃 IT演進(jìn)路徑。可以預(yù)見,未來的企業(yè)級(jí)存儲(chǔ)將是"AI存儲(chǔ)能力+自主存儲(chǔ)架構(gòu)"融合的形態(tài)。
3. 磁帶是數(shù)據(jù)的終極歸宿
在光盤存儲(chǔ)逐步退出后,磁帶就成了可支撐30年以上長(zhǎng)周期、高可靠、低成本存儲(chǔ)的"唯一"選擇,其可靠性遠(yuǎn)超硬盤3~4個(gè)數(shù)量級(jí)。目前最新的LTO10E單盤容量達(dá)到40TB,容量、密度、帶寬持續(xù)領(lǐng)先。IBM磁帶設(shè)備可在高速運(yùn)行中實(shí)時(shí)精準(zhǔn)定位,保證數(shù)據(jù)讀寫零偏差、高穩(wěn)定;而且磁帶更薄、韌性更強(qiáng),可支持高速穩(wěn)定運(yùn)行,不易拉伸和斷裂;同樣內(nèi)置抗量子加密,并支持WORM一次寫多次讀功能,可滿足金融、醫(yī)療、政務(wù)等行業(yè)長(zhǎng)期留存的要求;單位容量成本遠(yuǎn)低于硬盤、閃存與公有云歸檔。
4. 全場(chǎng)景分層存儲(chǔ)
在技術(shù)和產(chǎn)品層面不斷創(chuàng)新之外,IBM還以策略驅(qū)動(dòng)、智能感知、應(yīng)用無感為核心,構(gòu)建了覆蓋全數(shù)據(jù)生命周期的分層存儲(chǔ)體系,兼顧性能、成本、安全與合規(guī)。
IBM FlashSystem全閃存用于存儲(chǔ)熱數(shù)據(jù),主要面向ERP、核心數(shù)據(jù)庫、實(shí)時(shí)交易、AI推理等高并發(fā)、低延遲場(chǎng)景,提供微秒級(jí)響應(yīng)與7×24小時(shí)的高可用;溫?cái)?shù)據(jù)可存儲(chǔ)于IBM Storage Scale/Storage Ceph之上,以滿足AI訓(xùn)練、數(shù)據(jù)湖、數(shù)據(jù)分析、虛擬化、混合云等大容量、高吞吐、彈性擴(kuò)展場(chǎng)景的需求;磁帶庫用于長(zhǎng)期保留冷數(shù)據(jù),主要面向長(zhǎng)期歸檔、合規(guī)留存、低頻訪問數(shù)據(jù),實(shí)現(xiàn)極致的低成本、高可靠、長(zhǎng)壽命。
金鑫表示,全場(chǎng)景分層存儲(chǔ)的核心價(jià)值表現(xiàn)在,能夠按訪問頻率、重要性、生命周期自動(dòng)分層,實(shí)現(xiàn)智能自動(dòng)化遷移,無需人工干預(yù),并且開放兼容市場(chǎng)上主流的公有云,同時(shí)很好地利舊,在供應(yīng)鏈緊張、硬件成本倍增的背景下,切實(shí)踐行降本增效。
存儲(chǔ),做好自己的主角
在詞元經(jīng)濟(jì)時(shí)代,存儲(chǔ)不是配角,而是AI規(guī)模化落地的底座與命脈。在某種程度上,它決定了AI能不能跑起來,因?yàn)橹挥械脱舆t、高吞吐、大并發(fā)的存儲(chǔ),才能讓算力利用率持續(xù)提升;它決定了AI是否經(jīng)濟(jì),因?yàn)橹悄芊謱哟鎯?chǔ)可以將成本降到最優(yōu),讓AI擁有更強(qiáng)的盈利能力;它決定了AI的安全與合規(guī),量子安全加密、長(zhǎng)期留存等是業(yè)務(wù)連續(xù)的基本保證。
面對(duì)未來的存儲(chǔ)挑戰(zhàn),"讓AI走向數(shù)據(jù)"與"自主存儲(chǔ)"是IBM存儲(chǔ)戰(zhàn)略的兩大基石,將全面引領(lǐng)企業(yè)存儲(chǔ)邁向智能、自治、高效、安全。存儲(chǔ)將從被動(dòng)容器升級(jí)為主動(dòng)智能服務(wù)層,AI智能體由加分項(xiàng)變?yōu)闃?biāo)配,并深度融入運(yùn)維、優(yōu)化、安全與合規(guī)的全流程。全閃存+分布式存儲(chǔ)+磁帶的全棧分層存儲(chǔ)解決方案,將更好地幫助企業(yè)在多云、異構(gòu)、AI深度落地的環(huán)境中,掌握數(shù)據(jù)自主。