引言:AI技術(shù)革命的"雙子星"與系統(tǒng)化突破
2025年伊始,中國(guó)AI領(lǐng)域迎來(lái)標(biāo)志性突破——DeepSeek-R1開(kāi)源大模型以1/30于OpenAI o1的API成本實(shí)現(xiàn)同等推理性能的壯舉震動(dòng)全球,其"小力出奇跡"的技術(shù)哲學(xué)顛覆了傳統(tǒng)AI研發(fā)范式。緊隨其后,Manus智能體憑借多智能體協(xié)同與任務(wù)閉環(huán)執(zhí)行能力,在非公開(kāi)測(cè)試階段即引發(fā)"中國(guó)版AutoGPT"的熱議。這場(chǎng)由認(rèn)知模型(DeepSeek)與智能體執(zhí)行終端(Manus)共同掀起的風(fēng)暴,正推動(dòng)生成式AI從單點(diǎn)能力突破向系統(tǒng)化架構(gòu)躍遷。 行業(yè)數(shù)據(jù)顯示,搭載DeepSeek-R1的智能系統(tǒng)已在金融、醫(yī)療領(lǐng)域?qū)崿F(xiàn)8倍效率提升,而Manus展示的簡(jiǎn)歷篩選、股票分析等復(fù)雜任務(wù)處理能力,更驗(yàn)證了"思考-決策-執(zhí)行” 全鏈路智能化的五層式生成式人工智能應(yīng)用系統(tǒng)架構(gòu)日趨主流。這種"算法創(chuàng)新+工程突破"的雙輪驅(qū)動(dòng),標(biāo)志著中國(guó)在生成式人工智能系統(tǒng)架構(gòu)領(lǐng)域?qū)崿F(xiàn)從追隨到并跑的質(zhì)變。
本文接下來(lái)的內(nèi)容組織如下:
一、概念解析: 科普大語(yǔ)言模型(LLM)與智能體(AI Agent)的核心定義與技術(shù)邊界; 二、架構(gòu)拆解: 圍繞五層式生成式人工智能運(yùn)用系統(tǒng)架構(gòu)展開(kāi),包括:模型基座層,提示模板層,鏈?zhǔn)教幚韺樱悄荏w層,多智能體協(xié)作層; 三、技術(shù)賦能路徑: 解析七大技術(shù)要素(運(yùn)用定義系統(tǒng)、AI Fabric異構(gòu)算力調(diào)度、大模型基座、先進(jìn)液冷、可持續(xù)擴(kuò)展架構(gòu)、安全防護(hù)、智能體電算協(xié)同); 四、生態(tài)實(shí)踐:攜手合作伙伴開(kāi)展的3個(gè)方向上的創(chuàng)新工作介紹。
一、大模型LLM是認(rèn)知引擎(大腦), AI Agent是具身智能體”
人工智能技術(shù)正經(jīng)歷從判別式AI 1.0(以分類(lèi)、檢測(cè)為核心)向生成式AI 2.0(以創(chuàng)造、推理為特征)的范式躍遷。以DeepSeek-R1,OpenAIo1/o3等為代表的推理大模型,突破了早期模型的三大核心瓶頸:邏輯不可靠(如數(shù)學(xué)符號(hào)混淆)、幻覺(jué)頻發(fā)(如虛構(gòu)法律條文)和多模態(tài)協(xié)同不足(如跨文本-圖像推理斷裂)。 在回答問(wèn)題之前先生成一個(gè)詳細(xì)的內(nèi)部思維鏈,模擬人類(lèi)大腦的深思熟慮,逐步分解復(fù)雜的問(wèn)題,在提高答案的準(zhǔn)確性和深度上,取得了驚人的進(jìn)展,其表現(xiàn)出來(lái)的智慧程度,再次觸發(fā)業(yè)界對(duì)“大模型技術(shù)能力邊界“的熱議。
以Manus等為代表的AI Agent,是一種半自主系統(tǒng)(終極階段是全自主),能夠與環(huán)境交互并代表用戶(hù)執(zhí)行任務(wù),具有自主性,可以在無(wú)需持續(xù)人工干預(yù)的情況下工作。
AI Agent通過(guò)分析數(shù)據(jù)來(lái)進(jìn)行決策,并根據(jù)反饋不斷學(xué)習(xí)和改進(jìn),以適應(yīng)不斷變化的環(huán)境和用戶(hù)需求。這些智能系統(tǒng)廣泛應(yīng)用于各個(gè)領(lǐng)域,如智能客服、自動(dòng)駕駛汽車(chē)和智能家居助手等,為用戶(hù)提供高效便捷的服務(wù),幫助人們更好地應(yīng)對(duì)復(fù)雜多變的任務(wù)和挑戰(zhàn),提高工作和生活的效率。
二、五層式生成式人工智能運(yùn)用系統(tǒng)架構(gòu)的技術(shù)躍遷:構(gòu)建虛實(shí)融合的智能體協(xié)同
五層式生成式人工智能應(yīng)用系統(tǒng)架構(gòu)以大語(yǔ)言模型操作系統(tǒng)為核心基座,通過(guò)分層設(shè)計(jì)貫通底層算力資源支撐、模型訓(xùn)練與推理優(yōu)化、智能體任務(wù)編排,實(shí)現(xiàn)多智能體協(xié)作,形成從硬件資源到群體智能的全棧技術(shù)閉環(huán)。 其分層架構(gòu)及功能如下: 1、模型基座層(Models):作為系統(tǒng)基礎(chǔ)能力底座,通過(guò)多模態(tài)大模型API調(diào)用(如文本/圖像/代碼生成)與多機(jī)態(tài)支持(云端/邊緣端部署)構(gòu)建操作系統(tǒng)級(jí)服務(wù)能力,在成本控制與算力調(diào)度層面實(shí)現(xiàn)動(dòng)態(tài)優(yōu)化,支撐上層應(yīng)用開(kāi)發(fā)。 2、提示模板層(Prompt):通過(guò)結(jié)構(gòu)化模板設(shè)計(jì)實(shí)現(xiàn)動(dòng)態(tài)適配與場(chǎng)景復(fù)用,其核心機(jī)制包括變量占位符注入、角色指令分層(系統(tǒng)指令定義任務(wù)規(guī)則,用戶(hù)輸入填充動(dòng)態(tài)參數(shù)),以及多模態(tài)格式控制,顯著提升生成內(nèi)容與業(yè)務(wù)需求的匹配度,提升意圖識(shí)別準(zhǔn)確率。 該層通過(guò)工程化模板復(fù)用降低開(kāi)發(fā)復(fù)雜度,可借由預(yù)定義任務(wù)指令與上下文規(guī)則,結(jié)合多輪對(duì)話消息鏈實(shí)現(xiàn)復(fù)雜邏輯編排,也可使用LangChain的PromptTemplate類(lèi)實(shí)現(xiàn)跨領(lǐng)域任務(wù)快速遷移,提升模型輸出準(zhǔn)確率。 3、鏈?zhǔn)教幚韺樱–hains):基于思維鏈(CoT)技術(shù)構(gòu)建任務(wù)流水線引擎,將復(fù)雜需求拆解為有序子任務(wù)序列,包含順序鏈(Sequential Chain)確保線性執(zhí)行、路由鏈(Router Chain)實(shí)現(xiàn)條件分支,以及轉(zhuǎn)換鏈(Transform Chain)插入自定義處理邏輯,其核心價(jià)值在于標(biāo)準(zhǔn)化流程復(fù)用與靈活組合能力。 4、智能體層(Agent):能夠通過(guò)傳感器感知環(huán)境,并通過(guò)執(zhí)行器自主采取行動(dòng)以實(shí)現(xiàn)特定目標(biāo)的實(shí)體,其核心特性包括自主性(無(wú)需外部干預(yù))、反應(yīng)性(快速響應(yīng)環(huán)境變化)、主動(dòng)性(基于目標(biāo)主動(dòng)規(guī)劃)及社會(huì)性(與其他智能體協(xié)作)。 通過(guò)集成大語(yǔ)言模型(LLM)作為認(rèn)知中樞,結(jié)合工具調(diào)用(如API接口、機(jī)械臂控制)和長(zhǎng)期記憶模塊,實(shí)現(xiàn)從文本交互到物理世界改造的技術(shù)躍遷。 5、多智能體協(xié)作層(Multi-Agent):通過(guò)分布式自治架構(gòu)實(shí)現(xiàn)復(fù)雜任務(wù)的高效協(xié)同,其核心機(jī)制包括動(dòng)態(tài)任務(wù)分解、角色分工(如生成者、評(píng)審者、協(xié)調(diào)者等)以及智能體間的實(shí)時(shí)通信與協(xié)商,通過(guò)共享記憶網(wǎng)絡(luò)和共識(shí)模型實(shí)現(xiàn)全局狀態(tài)同步。 例如OpenManus框架通過(guò)PlanningTool將用戶(hù)需求拆解為線性子任務(wù)序列,并動(dòng)態(tài)分配至專(zhuān)業(yè)化智能體(如代碼生成Agent、部署驗(yàn)證Agent),結(jié)合工具鏈實(shí)現(xiàn)端到端閉環(huán);多智能體協(xié)作可通過(guò)信息共享與交叉驗(yàn)證,突破單一模型的認(rèn)知邊界,解決復(fù)雜長(zhǎng)鏈任務(wù)。 三、協(xié)同生態(tài)驅(qū)動(dòng)的全棧生成式AI架構(gòu)創(chuàng)新:安擎基于七大技術(shù)要素構(gòu)建五層式系統(tǒng),賦能虛擬認(rèn)知至物理改造的智能范式演進(jìn) 安擎協(xié)同生態(tài)合作伙伴圍繞生成式人工智能應(yīng)用系統(tǒng)架構(gòu)的七大技術(shù)要素:運(yùn)用定義系統(tǒng)架構(gòu)、GenAI光電路交換(OCS)互聯(lián)架構(gòu)、強(qiáng)韌大模型基座層、智能調(diào)試與根因定位技術(shù)、先進(jìn)液冷方案、可持續(xù)碳優(yōu)化計(jì)算體系、系統(tǒng)安全及智能體電算協(xié)同管理,構(gòu)建覆蓋虛擬認(rèn)知至物理改造的全棧技術(shù)體系,通過(guò)多層級(jí)技術(shù)融合實(shí)現(xiàn)五層式架構(gòu)(模型基座層→提示模板層→鏈?zhǔn)教幚韺印悄荏w層→多智能體協(xié)作層)的深度優(yōu)化。 2025年重點(diǎn)開(kāi)展的創(chuàng)新項(xiàng)目及工作介紹如下: 基于分布式OCS開(kāi)放互連技術(shù),首創(chuàng)“Switchless” Scale Up和Scale Out 雙向融合系統(tǒng)架構(gòu): 該系統(tǒng)架構(gòu)專(zhuān)為生成式人工智能(GenAI)應(yīng)用設(shè)計(jì),提供開(kāi)放互聯(lián)及靈活配置的優(yōu)化運(yùn)行環(huán)境,實(shí)現(xiàn)跨物理服務(wù)器的高速卡間與機(jī)間互聯(lián),充分滿足多樣化GenAI對(duì)大規(guī)模多維并行處理和實(shí)時(shí)數(shù)據(jù)交換的高要求。 分布式OCS技術(shù)憑借異構(gòu)資源池化與智能管理策略,顯著提升資源利用效率,確保業(yè)務(wù)應(yīng)用性能卓越與資源優(yōu)化,為構(gòu)建先進(jìn)的綠色智能計(jì)算開(kāi)放生態(tài)奠定堅(jiān)實(shí)基礎(chǔ)。同時(shí),該技術(shù)內(nèi)置的可靠容錯(cuò)與冗余機(jī)制,有效保障系統(tǒng)的高可用性和業(yè)務(wù)連續(xù)性,大幅降低系統(tǒng)故障風(fēng)險(xiǎn)。 通過(guò)首創(chuàng)的“Switchless”雙向融合系統(tǒng)架構(gòu),我們?cè)贏I服務(wù)器及系統(tǒng)架構(gòu)領(lǐng)域開(kāi)辟了一條全新路徑,有力推動(dòng)了多樣化GenAI業(yè)務(wù)的創(chuàng)新應(yīng)用與產(chǎn)品競(jìng)爭(zhēng)力的提升。 基于超流體技術(shù)的先進(jìn)冷板油冷方案,100%解決水冷板漏液業(yè)界痛點(diǎn): 高性能GPU和CPU因功耗巨大且散熱需求高,給Gen AI服務(wù)器系統(tǒng)的冷卻帶來(lái)了極大挑戰(zhàn)。目前,間接接觸液體冷卻系統(tǒng)(如冷板輔助方案)普遍采用水或丙二醇與水的混合物作為冷卻介質(zhì)。然而,在電子設(shè)備中,水冷系統(tǒng)存在泄漏隱患,一旦管理不當(dāng),可能會(huì)對(duì)敏感元件造成重大損害。即便是微小的泄漏,也可能引發(fā)短路和腐蝕,進(jìn)而導(dǎo)致系統(tǒng)停機(jī)或產(chǎn)生高昂的維修成本。盡管通過(guò)加強(qiáng)防漏連接、及時(shí)檢測(cè)泄漏和實(shí)施定期維護(hù)等常規(guī)工程措施可以降低這些風(fēng)險(xiǎn),但泄漏問(wèn)題依然難以完全根除。這已成為數(shù)據(jù)中心在大規(guī)模部署高端人工智能服務(wù)器時(shí),水冷解決方案所面臨的關(guān)鍵行業(yè)痛點(diǎn)之一。 本項(xiàng)目發(fā)布了一種創(chuàng)新的冷板液冷解決方案,該方案融合了基于綠色介電冷卻液的創(chuàng)新超流體技術(shù),以及優(yōu)化設(shè)計(jì)的冷板與中心分配單元(CDU)。 這一創(chuàng)新設(shè)計(jì)成功解決了水冷系統(tǒng)長(zhǎng)期存在的泄漏隱患這一行業(yè)難題,能夠在高密度AI服務(wù)器系統(tǒng)中對(duì)單芯片TDP(熱設(shè)計(jì)功耗)超過(guò)1500W的高性能處理器實(shí)現(xiàn)高效且可靠的冷卻。 Ultra Pooling GenAI Rack Scale系統(tǒng)架構(gòu)方案 “綠色超池智算基座”: 該實(shí)現(xiàn)方案以最小化的池化POD單元為基礎(chǔ)構(gòu)建模塊,包括專(zhuān)為推理設(shè)計(jì)的"通用AI加速卡"POD、企業(yè)級(jí)推理GPU POD,以及為大規(guī)模數(shù)據(jù)訓(xùn)練定制的GPU POD。 系統(tǒng)根據(jù)工作負(fù)載需求,動(dòng)態(tài)組合POD 節(jié)點(diǎn),以實(shí)現(xiàn)資源的高效配置。Ultra Host Processor Node(UHP)作為系統(tǒng)的智能管理中心,集中監(jiān)控和管理機(jī)架內(nèi)的服務(wù)器、存儲(chǔ)和網(wǎng)絡(luò)設(shè)備,負(fù)責(zé)供電、散熱、 遠(yuǎn)程控制、故障診斷、報(bào)警和系統(tǒng)安全管理。UHP也是 GenAI 應(yīng)用的優(yōu)化核心,提供模型感知、基于DeepSeek時(shí)代的Scaling Law策略的工作負(fù)載調(diào)度、機(jī)架級(jí)碳優(yōu)化計(jì)算,以及支持 Climatik 和 Gen AI Operator等運(yùn)作。Ultra Pooling Switch (UPS)利用開(kāi)放互聯(lián)OCS 技術(shù),執(zhí)行AI Fabric功能組裝,實(shí)現(xiàn)異構(gòu) GPU 資源的有效池化。與 Ultra Host Processor Node (UHP)相結(jié)合,UPS 能夠根據(jù)不同應(yīng)用場(chǎng)景的需求,靈活重構(gòu)系統(tǒng)資源池。UPS支持運(yùn)行包括 UALINK、Ethernet、OISA 在內(nèi)的Scale up 互聯(lián),確保 GPU POD之間的高效互聯(lián)。 綠色超池智算基座具備高度的適應(yīng)性,能夠覆蓋從數(shù)據(jù)中心到邊緣計(jì)算的多種部署場(chǎng)景。它不僅能夠擴(kuò)展成多機(jī)架的 Super POD,滿足超大規(guī)模數(shù)據(jù)中心的需求;也能在單機(jī) 架內(nèi)集成 CDU、UPS、儲(chǔ)能單元和電力算力協(xié)同單元,適用于企業(yè) 邊緣和邊緣數(shù)據(jù)中心等邊緣計(jì)算環(huán)境。這種靈活性使得系統(tǒng)能夠根據(jù)不同環(huán)境的需求進(jìn)行定制和擴(kuò)展。 后續(xù),安擎資深技術(shù)專(zhuān)家將陸續(xù)推出一系列技術(shù)專(zhuān)欄內(nèi)容,深入剖析前沿技術(shù)與行業(yè)應(yīng)用。若您對(duì)前沿技術(shù)洞察、實(shí)用技術(shù)干貨感興趣,歡迎持續(xù)關(guān)注我們,一同解鎖更多專(zhuān)業(yè)知識(shí)。