日前,在剛剛舉行的2023云棲大會上,百川智能創(chuàng)始人王小川暢談大模型時代,復(fù)旦特聘教授漆遠(yuǎn)借助復(fù)旦大學(xué)智能計算平臺CFFF引出人工智能推動科研范式變革,也有基于AIGC能力的兒童故事產(chǎn)品帶來分享。
當(dāng)一場云計算大會由AI相關(guān)內(nèi)容占據(jù)主論壇的半壁江山,或許已經(jīng)說明了“計算”風(fēng)向:AI正在成為不可忽視的計算主角。
AIGC將有更多爆發(fā)2024年是大模型商業(yè)化元年
過去十來年,云計算不斷發(fā)展、應(yīng)用,服務(wù)了社會數(shù)字化進(jìn)程。今天,隨著大模型技術(shù)的迅速發(fā)展,智能化時代正在開啟。人工智能將成為各行各業(yè)的新型生產(chǎn)力,以ChatGPT為代表的大模型應(yīng)用僅僅是一個開始。
今年以來,眾多大模型產(chǎn)品發(fā)布,基于大模型的AIGC技術(shù)在文本生成、知識回答、圖像生成、邏輯推理等方面表現(xiàn)出遠(yuǎn)超預(yù)期的效果,吸引了大量用戶與市場關(guān)注。
以生產(chǎn)力視角看,AIGC具備多方面優(yōu)勢,第一是大幅度節(jié)省人力和時間成本,很多東西可以秒級生成;第二是比較大幅度改善內(nèi)容質(zhì)量,經(jīng)過訓(xùn)練后輸出的內(nèi)容質(zhì)量超過95%以上人力的智能。
國內(nèi)推出的過百個大模型以基礎(chǔ)大模型為主,多停留在對話、圖像生成用途,AIGC的第三點(diǎn)優(yōu)勢尚不能體現(xiàn),即如同曾經(jīng)云計算帶來的數(shù)字化變革一般,將有助于眾多產(chǎn)業(yè)、行業(yè)的數(shù)字化,將為數(shù)字經(jīng)濟(jì)建設(shè)發(fā)揮重要作用。
因此,行業(yè)認(rèn)為當(dāng)下的AIGC火爆只是剛剛開始,后續(xù)還將迎來更多爆發(fā)。
圖源《中國AIGC產(chǎn)業(yè)全景報告暨AIGC 50》
《中國AIGC產(chǎn)業(yè)全景報告暨AIGC 50》顯示,預(yù)計2023年我國市場規(guī)模可達(dá)170億人民幣,AIGC企業(yè)在業(yè)務(wù)場景變現(xiàn)還處于探索驗(yàn)證時期。而后隨著產(chǎn)業(yè)加速增長,商業(yè)化落地逐漸深入、產(chǎn)業(yè)生態(tài)逐步完善,分別來到應(yīng)用蓬勃期(2025-2027)和整體加速期(2028-2030),2030年市場規(guī)模將超萬億人民幣,產(chǎn)業(yè)鏈、價值鏈和業(yè)務(wù)鏈完全整合在一起。
在AIGC產(chǎn)品百花齊放的同時,變現(xiàn)是大模型廠商們接下來必須要考慮的問題。
目前大模型的營收方式主要有四種:MaaS、按產(chǎn)出內(nèi)容量付費(fèi)、軟件訂閱付費(fèi)、模型定制開發(fā)費(fèi)。ChatGPT主要依賴軟件訂閱付費(fèi)和MaaS收入,其母公司OpenAI的CEO近日透露公司年化營收達(dá)13億美元(折合人民幣近95億)。
國內(nèi)廠商尚在進(jìn)行商業(yè)模式的探索,是參考ChatGPT還是綁定其他業(yè)務(wù)賺錢,大模型的營收變現(xiàn)有待進(jìn)一步明確。有AI芯片企業(yè)負(fù)責(zé)人表示,今年下半年開始,商業(yè)模式如何賺錢將成為大模型廠商的必答題。
他認(rèn)為,2024年將是大模型商業(yè)化的元年,也是關(guān)鍵一年。
智算需求只增不減明年迎海量部署消耗
看得見的AIGC蓬勃發(fā)展背后,是看不見的智能算力在支撐。
大模型爆發(fā)掀起了新一輪AI熱潮,也改變了智能算力需求與格局。
眾所周知,AI要經(jīng)過訓(xùn)練與推理兩個步驟,訓(xùn)練即模型產(chǎn)生的過程,推理即模型部署的過程。大模型從業(yè)者向筆者表示,大模型出來后則分成了三個階段:首先預(yù)訓(xùn)練,然后微調(diào)——把大模型垂直化,最后是推理部署。
“現(xiàn)在預(yù)訓(xùn)練的過程中,大家都是堆卡、堆集群,動不動燒幾千萬上億訓(xùn)練大模型。微調(diào)階段就已經(jīng)進(jìn)入了行業(yè)化,做推理的時候已經(jīng)進(jìn)入了商業(yè)部署,這兩個階段怎樣真正賺錢而不是像預(yù)訓(xùn)練那樣燒錢就變得非常重要。行業(yè)化和商業(yè)化的關(guān)鍵在于性價比,如何能夠真正大規(guī)模部署AI應(yīng)用,能不能通過底部支撐的算力系統(tǒng)集成部署打造極致性價比?”
產(chǎn)業(yè)專家指出,總體來看,大模型所需的智能算力需求將只增不減。今年通用大模型最火,單模型算力需求基本以千P為單位。未來大模型必然要走專業(yè)化、行業(yè)化的發(fā)展方向,形成眾多產(chǎn)業(yè)大模型,其算力單個需求可能只有幾百P,但產(chǎn)業(yè)場景越來越多,總量需求將比現(xiàn)有通用大模型的智能算力總需求更大。
智能算力從哪來?智算中心
根據(jù)工信部等六部門新政策中的定義,使用大規(guī)模異構(gòu)算力資源,包括通用算力(CPU)和智能算力(GPU、FPGA、ASIC等),主要為人工智能應(yīng)用——如人工智能深度學(xué)習(xí)模型開發(fā)、模型訓(xùn)練和模型推理等場景,提供所需算力、數(shù)據(jù)和算法的智算中心,在推進(jìn)人工智能和數(shù)字經(jīng)濟(jì)發(fā)展中發(fā)揮著重要作用。
成都智算中心
大模型需求驅(qū)動下,智算中心項目如雨后春筍般涌現(xiàn)。中國信通院云大所副所長栗蔚指出,預(yù)計2023年將有超過30個城市在建或者籌建智算的中心。而據(jù)中國IDC圈不完全統(tǒng)計,僅在2023年7月到9月,以“智算中心”為名字的項目規(guī)劃在建及建成的就超過36個,預(yù)計總投資規(guī)模超過460億。
有算力領(lǐng)域企業(yè)表示,當(dāng)前一些智算中心建設(shè)偏盲目,邏輯是“先建算力,再找需求”。
他判斷未來會趨向謹(jǐn)慎,尤其是to G(政府主導(dǎo))的智算中心建設(shè)。2024年國內(nèi)智算中心建設(shè),一定是先找當(dāng)?shù)氐乃懔ο{,再根據(jù)算力需求再建相關(guān)算力匹配。
“2024年大模型會大規(guī)模部署、賦能,這一過程中對于算力的消耗是海量的。”
從液冷應(yīng)用到多云部署大模型改變數(shù)據(jù)中心
智能化時代正在開啟,AI將成為各行各業(yè)的新型生產(chǎn)力,也對算力提出更高的要求。
今天,從大模型服務(wù)到底層智能算力再到算力基礎(chǔ)設(shè)施,都正在面向AI時代進(jìn)行全面的技術(shù)升級和創(chuàng)新。
算力市場分為三個層級,在大模型位于的最上層,面臨系統(tǒng)的適配中心、業(yè)務(wù)遷移耗時、定制開發(fā)的投入等問題。中層的算力平臺需要滿足支持CPU+GPU的調(diào)用、硬件接口的統(tǒng)一、互聯(lián)協(xié)議的標(biāo)準(zhǔn)、軟件生態(tài)的兼容性等要求。在最下層,即智算中心這一基礎(chǔ)設(shè)施層,主要解決大算力背景下的高電能散熱問題。
此前數(shù)據(jù)中心以普通CPU服務(wù)器為主,AI大模型訓(xùn)練和推理運(yùn)算使用GPU服務(wù)器,單臺設(shè)備的額定功率最高達(dá)12千瓦以上,遠(yuǎn)超CPU功率水平。當(dāng)前數(shù)據(jù)中心單機(jī)柜功率以6kw、8kw為主,4KW亦不少見,未來智算中心單機(jī)柜功率可能十幾千瓦,幾十千瓦,單體智算中心可能上百兆瓦。
高功耗帶來高熱量,原有風(fēng)冷很難滿足GPU散熱需求,液冷成為更好的解決方案。除散熱效率更高外,占地面積低、綠色節(jié)能也是液冷的優(yōu)勢。今年以來,液冷在數(shù)據(jù)中心的應(yīng)用部署量已經(jīng)顯著上升。
當(dāng)單個計算中心的算力無法滿足大模型的巨大算力需求,需要將多個算力中心連接起來,共同為大模型提供訓(xùn)練的相關(guān)能力,同時巨大算力消耗又帶來高能源消耗。
因此,單機(jī)柜高功率、高效散熱、低PUE、多云間的互聯(lián)、滿足云架構(gòu)的部署,都是大模型發(fā)展對智能算力與智算中心提出諸多新要求。
此外,大模型訓(xùn)練與推理場景的不同,生物醫(yī)療、圖像識別等不同應(yīng)用對算力精度的不同需求,也影響著智算的布局與算力配置。
更多內(nèi)容,將在IDCC2023上帶來分享與討論!
第十八屆中國IDC產(chǎn)業(yè)年度盛典(IDCC2023)將于2023年12月12-14日在北京國家會議中心隆重舉行,大會主題為“算力進(jìn)化數(shù)字開物”,聚焦算力產(chǎn)業(yè)熱點(diǎn)話題,匯聚業(yè)內(nèi)精英人士,共同探討數(shù)字經(jīng)濟(jì)的發(fā)展方向和未來趨勢。歡迎報名,現(xiàn)場參與!