大(dà)模型“計(jì)算(suàn)”時(shí)代 曙光搶先突圍
伴随8家(jiā)大(dà)模型陸續通(tōng)過《生(shēng)成式人(rén)工智能服務管理(lǐ)暫行(xíng)辦法》備案,文心一言率先向全社會(huì)全面開(kāi)放,AIGC将真正迎來(lái)在國內(nèi)實際落地開(kāi)花(huā)的時(shí)期,“百模大(dà)戰”也将愈演愈烈。
ChatGPT帶動AIGC火(huǒ)爆的背後,人(rén)工智能算(suàn)力需求也随之暴漲。公開(kāi)資料顯示,GPT-4的模型擁有(yǒu)近1.8萬億參數(shù)、13萬億訓練數(shù)據,其訓練一次的成本高(gāo)達6300萬美元,大(dà)模型對算(suàn)力的依賴顯而易見。除增加算(suàn)力資源供給外,算(suàn)力利用率優化、使用門(mén)檻降低(dī)也至關重要。
無疑,實現算(suàn)力、算(suàn)法及應用的智能、協同調度,将算(suàn)力更高(gāo)效地轉化為(wèi)生(shēng)産力,成為(wèi)制(zhì)勝百模争“算(suàn)”時(shí)代的關鍵。
作(zuò)為(wèi)全産業鏈覆蓋的核心信息基礎設施企業,曙光對于大(dà)模型及大(dà)規模算(suàn)力的支持與經驗,遠早于2023年。
近年來(lái),基于對産業的深入洞察和(hé)前瞻預判,曙光在全國範圍內(nèi)構建了包括智算(suàn)中心、雲中心、一體(tǐ)化大(dà)數(shù)據中心在內(nèi)的各類算(suàn)力中心,掌握了豐富多(duō)樣且通(tōng)用性極強的算(suàn)力資源。通(tōng)過智能化調度和(hé)資源管理(lǐ),将算(suàn)力資源上(shàng)雲聯網,并以創新型算(suàn)力服務平台為(wèi)出口,面向不同行(xíng)業區(qū)域的用戶提供可(kě)便捷獲取的算(suàn)力和(hé)應用。
截至目前,曙光已參與“悟道(dào)2.0”、“紫東太初”、“文心一言”、“通(tōng)義千問”等多(duō)類大(dà)模型的訓練、微調、推理(lǐ)等工作(zuò),為(wèi)其提供強勁算(suàn)力支撐。累計(jì)完成30餘個(gè)國內(nèi)外主流大(dà)模型的适配孵化,包括業界熟知的GPT系列、LLaMA系列、GLM系列等。同等條件下,大(dà)模型訓練效率及訓練穩定性都得(de)到顯著提升。
此外,針對大(dà)模型訓練帶來(lái)的挑戰,曙光緊密協同生(shēng)态夥伴,與百度、阿裏、智源研究院、智譜AI、複旦大(dà)學、之江實驗室、捷通(tōng)華聲等業內(nèi)領先企業及科研院所深度合作(zuò),充分調動起政、産、學、研、用各方力量,打造了面向不同應用場(chǎng)景的大(dà)模型一體(tǐ)機、大(dà)模型存儲解決方案等,提供從底層算(suàn)力、框架、算(suàn)法、應用等全棧AI能力,滿足多(duō)場(chǎng)景需求,加速大(dà)模型探索創新及産業化落地。
與此同時(shí),由于大(dà)模型對算(suàn)力的巨大(dà)需求,能耗問題日益嚴峻。自2011年開(kāi)啓,曙光便緻力于相關探索,研發了領先的浸沒式相變液冷技(jì)術(shù)和(hé)冷闆式冷卻技(jì)術(shù),構建了包含計(jì)算(suàn)和(hé)存儲的全棧綠色計(jì)算(suàn)方案,并已成功實現商業化部署。相比傳統風冷模式,在同等功率下,可(kě)為(wèi)AI計(jì)算(suàn)核心部件降溫20-30°C;在同等性能下,為(wèi)算(suàn)力設備降低(dī)能耗30%。目前,中國有(yǒu)超過58%的液冷數(shù)據中心選擇了曙光的技(jì)術(shù)方案。
信息産業在演變的每個(gè)階段,都會(huì)有(yǒu)主流的技(jì)術(shù)應用方向。在“萬變”的環境中,唯有(yǒu)把握前瞻趨勢、堅持打造核心競争力才是應對變化的“不變”法則。無論是大(dà)模型,還(hái)是下一個(gè)新“風口”,曙光早已在等候。