由開(kāi)放計(jì)算社區(qū)OCP及開(kāi)放標(biāo)準(zhǔn)組織OCTC(中國(guó)電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)開(kāi)放計(jì)算標(biāo)準(zhǔn)工作委員會(huì))聯(lián)合主辦的2024開(kāi)放計(jì)算中國(guó)峰會(huì)日前在北京召開(kāi)。峰會(huì)以“開(kāi)放協(xié)同:協(xié)作、智慧、創(chuàng)新”為主題,來(lái)自百度、阿里云、中國(guó)工商銀行、字節(jié)跳動(dòng)、三星電子、浪潮信息、英偉達(dá)、英特爾等頭部企業(yè)的社區(qū)領(lǐng)袖、技術(shù)大咖、行業(yè)專(zhuān)家就數(shù)據(jù)中心基礎(chǔ)設(shè)施、人工智能創(chuàng)新、開(kāi)放計(jì)算生態(tài)、綠色計(jì)算發(fā)展、開(kāi)放系統(tǒng)&CXL(一種高速互聯(lián)協(xié)議)等熱點(diǎn)議題,與參會(huì)的千余名IT工程師和數(shù)據(jù)中心從業(yè)者進(jìn)行了深入、全面的技術(shù)探討和實(shí)踐分享,現(xiàn)場(chǎng)氛圍熱烈。
此外,大會(huì)上還有幾項(xiàng)重要的發(fā)布。大會(huì)宣布開(kāi)放算力模組規(guī)范(OCM)正式啟動(dòng)立項(xiàng),以CPU、內(nèi)存為核心構(gòu)建最小算力單元,兼容x86、ARM等多架構(gòu)芯片的多代處理器,從而方便用戶(hù)根據(jù)應(yīng)用場(chǎng)景靈活、快速組合。首批成員包括中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究院、百度、浪潮信息、英特爾、AMD、小紅書(shū)、聯(lián)想、超聚變等。本次大會(huì),OCP首次設(shè)立了開(kāi)放計(jì)算最佳創(chuàng)新獎(jiǎng)、開(kāi)放計(jì)算最佳實(shí)踐獎(jiǎng)和開(kāi)放計(jì)算生態(tài)貢獻(xiàn)獎(jiǎng),以此表彰在上述領(lǐng)域做出卓越貢獻(xiàn)的社區(qū)成員。首屆開(kāi)放計(jì)算最佳創(chuàng)新獎(jiǎng)由阿里云、三星和村田獲得,百度和字節(jié)跳動(dòng)獲得開(kāi)放計(jì)算最佳實(shí)踐獎(jiǎng),浪潮信息和安謀科技獲得開(kāi)放計(jì)算生態(tài)貢獻(xiàn)獎(jiǎng)。OCP和OCTC還在會(huì)上聯(lián)合發(fā)布了全球開(kāi)放計(jì)算十大創(chuàng)新成果,包括超大規(guī)模數(shù)據(jù)中心部署指南、Evenstar開(kāi)放式5G平臺(tái)、液冷式人工智能加速卡設(shè)計(jì)技術(shù)要求等等,進(jìn)一步體現(xiàn)出開(kāi)放計(jì)算在數(shù)據(jù)中心領(lǐng)域所具備的創(chuàng)新活力。
開(kāi)源開(kāi)放意味著更高效的創(chuàng)新,因?yàn)榧夹g(shù)開(kāi)放使得不同組織和個(gè)人能夠共享知識(shí)、代碼和工具,從而加速了技術(shù)的研發(fā)和創(chuàng)新過(guò)程。這種開(kāi)放的環(huán)境鼓勵(lì)了更多的實(shí)驗(yàn)和試錯(cuò),促進(jìn)了新技術(shù)的快速迭代和成熟。而對(duì)于初創(chuàng)企業(yè)和小型開(kāi)發(fā)者來(lái)說(shuō),他們可以基于已有的開(kāi)源項(xiàng)目或平臺(tái)進(jìn)行二次開(kāi)發(fā),大大降低了創(chuàng)新的門(mén)檻,使得更多的人才和資源能夠投入到創(chuàng)新活動(dòng)中去。更為重要的是,開(kāi)放有助于構(gòu)建開(kāi)放的技術(shù)生態(tài),吸引更多的開(kāi)發(fā)者、企業(yè)和用戶(hù)參與進(jìn)來(lái)。這種生態(tài)的形成促進(jìn)了產(chǎn)業(yè)鏈的上下游協(xié)作,推動(dòng)了整個(gè)產(chǎn)業(yè)的快速發(fā)展,為產(chǎn)業(yè)升級(jí)提供了重要支撐。開(kāi)源開(kāi)放也成就了AI當(dāng)下的火熱,超過(guò)80%的AI項(xiàng)目使用開(kāi)源框架進(jìn)行開(kāi)發(fā)。
開(kāi)放計(jì)算是全球數(shù)據(jù)中心領(lǐng)域在產(chǎn)業(yè)協(xié)同模式的創(chuàng)新,以開(kāi)放計(jì)算組織為平臺(tái)和載體,實(shí)現(xiàn)IT基礎(chǔ)架構(gòu)產(chǎn)品、規(guī)范、知識(shí)產(chǎn)權(quán)等成果的共享,從而推動(dòng)和加速技術(shù)創(chuàng)新,以更有效地支持各行業(yè)對(duì)IT基礎(chǔ)架構(gòu)不斷增長(zhǎng)的需求。通過(guò)開(kāi)放計(jì)算可以降低數(shù)據(jù)中心技術(shù)獲取成本,推動(dòng)創(chuàng)新技術(shù)普及;激發(fā)創(chuàng)新活力,讓更多的組織和個(gè)人能獲益;并推動(dòng)數(shù)據(jù)中心節(jié)能降碳,實(shí)現(xiàn)可持續(xù)發(fā)展。
正因?yàn)橐庾R(shí)到開(kāi)放的力量,開(kāi)放計(jì)算受到越來(lái)越多公司的支持并積極投身其中。在過(guò)去的三年中,OCP的成員數(shù)量從250多家增長(zhǎng)至360多家,增幅接近50%,社區(qū)項(xiàng)目和子項(xiàng)目數(shù)量超過(guò)40個(gè)。與此同時(shí),OCTC的成員數(shù)量也在一年內(nèi)迅速翻倍,從40多家增長(zhǎng)至近百家,快速構(gòu)建起包含基礎(chǔ)設(shè)施、測(cè)評(píng)與服務(wù)、運(yùn)維管理等在內(nèi)的標(biāo)準(zhǔn)框架,并將通用計(jì)算、柜計(jì)算、AI異構(gòu)、液冷等列入標(biāo)準(zhǔn)化建設(shè)的重點(diǎn)內(nèi)容。
以AIGC為代表的AI應(yīng)用的興起,使得算力需求呈爆炸式增長(zhǎng),多元算力成趨勢(shì),AI芯片的多元化、通用服務(wù)器的多元化趨勢(shì)明顯,傳統(tǒng)算力基礎(chǔ)設(shè)施在性能上和效能上都已無(wú)法滿(mǎn)足應(yīng)用的需求。
浪潮信息服務(wù)器產(chǎn)品線總經(jīng)理趙帥認(rèn)為,為應(yīng)對(duì)AI大模型的規(guī)模性和復(fù)雜性,算力等基礎(chǔ)設(shè)施需要在單系統(tǒng)性能提升(Scale up)和集群規(guī)模擴(kuò)展(Scale out)方面來(lái)解決挑戰(zhàn)。Scale up通過(guò)更強(qiáng)大或更多AI加速卡、處理器以及更高速互聯(lián)通信,來(lái)增加單個(gè)設(shè)備或節(jié)點(diǎn)的計(jì)算能力和計(jì)算效率;Scale out則通過(guò)不斷增加計(jì)算節(jié)點(diǎn)構(gòu)建大規(guī)模集群來(lái)滿(mǎn)足AI大模型的算力需求。
OCP推動(dòng)了開(kāi)放加速模塊規(guī)范(OAM)的落地,以實(shí)現(xiàn)多元算力芯片的適配兼容,降低資源投入,使算力部署和迭代提速,從而更好支撐AIGC應(yīng)用。據(jù)悉,目前已有20多家芯片企業(yè)支持OAM規(guī)范,市場(chǎng)上90% 高端AI芯片也是基于OAM規(guī)范設(shè)計(jì)。事實(shí)上,OAM已經(jīng)成為全球性的標(biāo)準(zhǔn)。
在AI時(shí)代,一切計(jì)算皆AI。x86、ARM、RISC-V等不同架構(gòu)的芯片高速發(fā)展,讓多元化算力的趨勢(shì)更加明顯。但是,不同CPU處理器的接口和管理協(xié)議都不同,這使得硬件開(kāi)發(fā)、固件適配、部件測(cè)試資源等時(shí)間和成本激增,給算力系統(tǒng)設(shè)計(jì)帶來(lái)巨大挑戰(zhàn)。這也是上文提到的開(kāi)放算力模組規(guī)范(OCM)正式啟動(dòng)立項(xiàng)的價(jià)值與意義所在。
此次大會(huì)還就有一個(gè)熱點(diǎn)議題——CXL。當(dāng)前,內(nèi)存和I/O的擴(kuò)展能力已遠(yuǎn)落后于AI帶來(lái)的計(jì)算密度的增長(zhǎng),而CXL攻克了大規(guī)模高密度計(jì)算中內(nèi)存容量、帶寬及I/O延遲等難題,支持內(nèi)存擴(kuò)展與共享,并與GPU、FPGA等外設(shè)無(wú)縫對(duì)接,提供前所未有的數(shù)據(jù)交換與處理效率,能夠?qū)崿F(xiàn)計(jì)算性能飛躍。
推動(dòng)OCM立項(xiàng),發(fā)布多款符合OAM規(guī)范的AI服務(wù)器,將CXL技術(shù)引入融合架構(gòu)3.0原型系統(tǒng)……作為開(kāi)源開(kāi)放的倡導(dǎo)者,浪潮信息在開(kāi)放計(jì)算社區(qū)的參與度越來(lái)越深,貢獻(xiàn)設(shè)計(jì)規(guī)劃,牽頭標(biāo)準(zhǔn)制定,并希望聯(lián)合開(kāi)放社區(qū)伙伴,通過(guò)技術(shù)的創(chuàng)新迭代帶動(dòng)上下游產(chǎn)業(yè)的發(fā)展,為算力產(chǎn)業(yè)高質(zhì)量發(fā)展賦能。