杭州2026年5月28日 /美通社/ -- 當(dāng)前,AI大模型已達(dá)到萬(wàn)億級(jí)參數(shù)、百萬(wàn)Token(詞元)上下文長(zhǎng)度的規(guī)模,且規(guī)模仍在持續(xù)提升。智算中心已進(jìn)入"系統(tǒng)效率競(jìng)爭(zhēng)"階段,為滿(mǎn)足AI大模型訓(xùn)練和推理需求,GPU集群要實(shí)現(xiàn)高效運(yùn)行,必須依托算力、網(wǎng)絡(luò)、存儲(chǔ)、調(diào)度和運(yùn)維的整體協(xié)同。其中,存儲(chǔ)系統(tǒng)正從傳統(tǒng)的數(shù)據(jù)承載平臺(tái),升級(jí)為影響GPU利用率、訓(xùn)練效率和業(yè)務(wù)連續(xù)性的關(guān)鍵基礎(chǔ)設(shè)施。
面對(duì)海量訓(xùn)練數(shù)據(jù)、高并發(fā)訪問(wèn)、Checkpoint快速讀寫(xiě)、冷熱數(shù)據(jù)混合管理等需求,云尖信息推出了高性能、高可靠、可擴(kuò)展的分布式存儲(chǔ)解決方案。
云尖信息分布式存儲(chǔ)解決方案
云尖信息分布式存儲(chǔ)解決方案,采用"高性能全閃層 + 大容量混閃層 + 高速無(wú)損網(wǎng)絡(luò) + 分布式并行文件系統(tǒng) + 多協(xié)議統(tǒng)一訪問(wèn)"的架構(gòu)設(shè)計(jì),以CS8000 X6與CS6000 X6雙產(chǎn)品協(xié)同,構(gòu)建分層數(shù)據(jù)底座,充分適配大模型訓(xùn)推場(chǎng)景和高性能計(jì)算場(chǎng)景,成為智算中心建設(shè)的優(yōu)選方案。
雙產(chǎn)品協(xié)同,CS8000+CS6000構(gòu)建分層數(shù)據(jù)底座
在分層架構(gòu)中,CS8000 X6面向高性能數(shù)據(jù)訪問(wèn)需求,單節(jié)點(diǎn)順序讀帶寬可達(dá)40GB/s;在典型小文件測(cè)試場(chǎng)景下,IOPS可達(dá)400K+。其作為全閃加速層,主要承載大模型訓(xùn)練熱數(shù)據(jù)集、Checkpoint高頻讀寫(xiě)、模型加載與分發(fā)、高并發(fā)文件訪問(wèn)、低時(shí)延數(shù)據(jù)訪問(wèn)等需求。
CS6000 X6面向海量數(shù)據(jù)承載需求,支持大規(guī)模橫向擴(kuò)展,單文件系統(tǒng)容量可達(dá)200PB以上。其作為混閃容量層,主要承載海量非結(jié)構(gòu)化數(shù)據(jù)、冷熱混合數(shù)據(jù)集、全量訓(xùn)練數(shù)據(jù)與歷史數(shù)據(jù)、日志歸檔備份、視頻圖像文檔等大容量文件及中長(zhǎng)期數(shù)據(jù)生命周期管理等需求。
兩者協(xié)同形成"高性能訪問(wèn)+大容量承載"的分布式存儲(chǔ)體系, 滿(mǎn)足AI 訓(xùn)練、集群推理與HPC場(chǎng)景下的數(shù)據(jù)訪問(wèn)和長(zhǎng)期管理需求。
從技術(shù)能力到業(yè)務(wù)收益,全維度解決行業(yè)痛點(diǎn)
基于上述架構(gòu),云尖信息分布式存儲(chǔ)解決方案從性能釋放、數(shù)據(jù)保護(hù)、彈性擴(kuò)展、協(xié)議兼容、平滑遷移與智能管理等維度,支撐 AI 訓(xùn)練、集群推理與 HPC 場(chǎng)景中的多樣化數(shù)據(jù)訪問(wèn)需求。
1、高性能并行訪問(wèn),提升GPU集群利用率
AI訓(xùn)練、HPC仿真、多模態(tài)數(shù)據(jù)處理對(duì)高吞吐、低時(shí)延和高并發(fā)訪問(wèn)要求較高,方案通過(guò)高性能分布式并行存儲(chǔ)與高速網(wǎng)絡(luò)協(xié)同,降低大規(guī)模并發(fā)訪問(wèn)場(chǎng)景下容易出現(xiàn) I/O 瓶頸的問(wèn)題,減少 GPU 等待數(shù)據(jù)的時(shí)間,讓算力資源得到更充分釋放。
2、分層數(shù)據(jù)承載,優(yōu)化存儲(chǔ)成本與數(shù)據(jù)分層管理
面對(duì)訓(xùn)練數(shù)據(jù)、模型文件、Checkpoint、中間結(jié)果、日志和歸檔數(shù)據(jù)的持續(xù)增長(zhǎng),方案通過(guò)CS8000全閃高性能層與CS6000混閃容量層協(xié)同,將高頻熱數(shù)據(jù)與低頻冷數(shù)據(jù)分層承載,在保障性能的同時(shí)降低全量全閃帶來(lái)的成本壓力。
3、多協(xié)議統(tǒng)一訪問(wèn),減少數(shù)據(jù)孤島與遷移復(fù)雜度
方案通過(guò)多協(xié)議兼容和統(tǒng)一數(shù)據(jù)訪問(wèn)能力,適配AI、HPC、大數(shù)據(jù)和通用業(yè)務(wù)環(huán)境,減少多套存儲(chǔ)系統(tǒng)并存帶來(lái)的數(shù)據(jù)重復(fù)、遷移復(fù)雜和管理割裂,有效降低數(shù)據(jù)遷移成本。
4、分布式高可靠架構(gòu),支撐業(yè)務(wù)連續(xù)與彈性擴(kuò)展
智算中心從幾十卡、百卡向千卡、萬(wàn)卡演進(jìn),存儲(chǔ)不僅要擴(kuò)容量,還要同步擴(kuò)性能。方案通過(guò)多副本、糾刪碼、快照、遠(yuǎn)程復(fù)制、故障自動(dòng)修復(fù)與橫向擴(kuò)展能力,保障硬盤(pán)、節(jié)點(diǎn)及網(wǎng)絡(luò)故障下的業(yè)務(wù)連續(xù)運(yùn)行,并支撐智算中心后續(xù)規(guī)模擴(kuò)展。
以高效數(shù)據(jù)底座支撐新一代智算中心
在智算中心建設(shè)中,算力決定上限,存儲(chǔ)決定效率,網(wǎng)絡(luò)決定協(xié)同。云尖信息分布式存儲(chǔ)解決方案以CS8000 X6和CS6000 X6為核心,構(gòu)建覆蓋高性能熱數(shù)據(jù)訪問(wèn)與大容量數(shù)據(jù)管理的分層存儲(chǔ)體系,為AI訓(xùn)練、集群推理、HPC 和海量非結(jié)構(gòu)化數(shù)據(jù)處理提供穩(wěn)定支撐。
未來(lái),云尖信息將持續(xù)完善面向 AIDC 智算中心的服務(wù)器、存儲(chǔ)、網(wǎng)絡(luò)、液冷和運(yùn)維服務(wù)能力,以高效、可靠、可擴(kuò)展的數(shù)據(jù)底座,支撐客戶(hù)智算基礎(chǔ)設(shè)施建設(shè)與業(yè)務(wù)持續(xù)演進(jìn)。