全面定義大模型長時運行與混沌負載特征,推進行業(yè)分工與消費端質(zhì)量監(jiān)控標準化
北京2026年6月11日 /美通社/ -- 2026年以來,隨著Claude Code、OpenClaw等智能體(AI Agent)技術(shù)的全面破圈,AGI正式邁入新紀元。正如黃仁勛在GTC 2026主題演講中所強調(diào)的:大語言模型(LLM)正從簡單的對話機器人,加速演進為能夠自主規(guī)劃、推理并采取行動以達成復(fù)雜目標的長時運行系統(tǒng)。這一趨勢下,大模型推理算力需求呈井噴式增長,"Token工廠"概念躍升為資本、產(chǎn)業(yè)與技術(shù)界的核心焦點。
然而,智能體(Agentic)的工作負載與傳統(tǒng)的人類對話交互在結(jié)構(gòu)上截然不同。它通常呈現(xiàn)為長周期的多輪循環(huán),在"推理階段"和"行動階段"之間高頻切換。隨著AI從"對話式生成"全面駛?cè)?quot;自主智能體"的深水區(qū),算力基礎(chǔ)設(shè)施的生產(chǎn)、度量與消耗標準迎來解構(gòu)性變革。
今日,軟通動力正式宣布,其首個標桿示范項目——"北京壹號詞元工廠" 正式投入運行,并同步向全球發(fā)布并開源"軟通動力詞元工廠性能基準"。這標志著大模型算力消耗正式告別粗放式的吞吐量比拼,步入標準化、工業(yè)化的"Token流水線"時代。
北京壹號詞元工廠:面向智能體時代的"新型電廠"
作為軟通動力AI戰(zhàn)略的重要組成部分,北京壹號詞元工廠聚焦Agentic Serving(智能體服務(wù))場景,通過極限工程化手段壓榨硬件性能,集成前沿算力調(diào)度與KV Cache極致復(fù)用算法,以確定性的服務(wù)質(zhì)量與極致的性價比,向全社會輸出標準化的"數(shù)字燃料"——Token,為智算時代提供確定性、高彈性的供應(yīng)保障。
北京壹號詞元工廠項目負責人表示:"北京作為全國AI創(chuàng)新高地,集聚了最多的大模型公司和智能體應(yīng)用團隊,對新型算力服務(wù)的需求最迫切、最前沿。建設(shè)與之匹配的'Token工廠'是北京打造'全球數(shù)字經(jīng)濟標桿城市'的必然要求。Agentic Serving帶來了天然復(fù)雜的業(yè)務(wù)邏輯。一個簡單的最終指令背后,可能是模型內(nèi)部數(shù)十次推理循環(huán)、工具調(diào)用與自我反思的疊加。這種極度的不確定性,使得傳統(tǒng)的靜態(tài)壓測指標完全失效。行業(yè)陷入'指標迷霧':底層建設(shè)者不知如何針對長上下文優(yōu)化架構(gòu),算力運營者難以預(yù)估動態(tài)波動下的并發(fā)水位,企業(yè)級使用者缺乏明確的SLA作為采購依據(jù),最終用戶則頻繁遭遇首字延遲不可控和推理中途斷線的糟糕體驗。我們發(fā)布這一基準,正是為了打造統(tǒng)一的'標桿之鏡'。"
同步發(fā)布:開源詞元工廠性能基準
為了精準捕捉并復(fù)現(xiàn)智能體服務(wù)環(huán)境中的極端壓力,軟通動力在發(fā)布會上宣布:正式開源詞元工廠性能基準,該基準不是單一工具,而是一個三層遞進的完整評測體系,遵循"一個基準(刻畫方法)",采用"三類測試方法",構(gòu)建"分領(lǐng)域標準數(shù)據(jù)集" ,實現(xiàn)對算力集群真實服務(wù)能力的精準評估與公平對比。
軟通動力對基于大模型發(fā)展初期行業(yè)通用的MLPerf LoadGen進行了深度重構(gòu),實現(xiàn)了從靜態(tài)并發(fā)注入到動態(tài)行為仿真的跨越,發(fā)展出了 LoadGen 2.0。其核心突破在于:成功在測試環(huán)境中定義并重現(xiàn)了真實的"混沌局面",它定義了"大家共識的混沌系統(tǒng)如何刻畫和重現(xiàn)"——這是所有評測的根基。
以此為根基,軟通動力構(gòu)建了三層遞進的完整評測體系:
LoadGen 2.0已完全開源(GitHub: github.com/issair/loadgen2)。
軟通動力的核心能力
隨著技術(shù)成熟,大模型行業(yè)正復(fù)制傳統(tǒng)工業(yè)的發(fā)展軌跡——模型算法研發(fā)、算力基礎(chǔ)設(shè)施運營(Token生產(chǎn))、智能體路由分發(fā)以及垂直場景應(yīng)用逐步解耦。專業(yè)的Token工廠需要具備"軟硬一體"的全棧能力。
軟通動力在以下方面形成了差異化能力
目前,軟通動力正深度參與平潭兩岸融合算力中心、韶關(guān)公共算力服務(wù)平臺等國家一體化算力網(wǎng)絡(luò)重點項目建設(shè),并依托睿動智能體平臺,打造連接國際云廠商與國產(chǎn)AI新勢力的全球化AI雙向樞紐。北京壹號詞元工廠的啟動,是公司推進AI基礎(chǔ)設(shè)施布局、構(gòu)建Token生態(tài)體系的重要實踐。
未來,軟通動力將持續(xù)推進"Token工廠"建設(shè),并從消費者視角出發(fā)推出"實時監(jiān)測"等一系列質(zhì)量監(jiān)控方法——如同在城市自來水管網(wǎng)中部署實時純凈度探針一般,在運行端動態(tài)監(jiān)控Token生成的幻覺率、語義一致性及毫秒級延遲波動。這將幫助用戶更直觀地了解所使用算力服務(wù)的真實質(zhì)量,推動行業(yè)建立更加透明、可信的評測體系。