王淳
7月13日,上海交通大學(xué)重慶人工智能研究院“兆言”大模型發(fā)布會(huì)在西部(重慶)科學(xué)城召開?;顒?dòng)現(xiàn)場(chǎng)發(fā)布了該研究院最新研發(fā)成果——“兆言”大模型產(chǎn)品(下稱:“兆言”),這也是重慶首個(gè)自主研發(fā)的大語言模型。
據(jù)了解,兆言大模型是上海交通大學(xué)重慶人工智能研究院基于全球領(lǐng)先的AI大模型技術(shù)研發(fā)出的最新成果,其建立是通過積累海量數(shù)據(jù),輔以獨(dú)特的數(shù)據(jù)處理和AI訓(xùn)練技術(shù),以達(dá)到精準(zhǔn)、專業(yè)的文本輸出,并且能夠?qū)崿F(xiàn)以自然語言選擇、調(diào)用應(yīng)用程序的能力,助力打造個(gè)性化的智能產(chǎn)品。
發(fā)布會(huì)上,上海交通大學(xué)重慶人工智能研究院院長(zhǎng)、首席科學(xué)家金石介紹,和通用大模型相比,“兆言”大模型擁有“領(lǐng)域精調(diào)效率高、訓(xùn)練推理成本低、人機(jī)交互能力強(qiáng)”的特點(diǎn)。
通用大模型在行業(yè)落地面臨許多困難。比如,未經(jīng)行業(yè)精調(diào)的通用模型在行業(yè)應(yīng)用中表現(xiàn)不佳、通用大模型需要的算力資源不易進(jìn)行私有化部署、自然語言轉(zhuǎn)API調(diào)用不穩(wěn)定等?!罢籽浴贝竽P洼^好地解決這些問題。
“兆言”大模型由齊鵬博士領(lǐng)銜,沈國(guó)陽、潘楊分別負(fù)責(zé)技術(shù)和產(chǎn)品。該模型采用啟發(fā)式數(shù)據(jù)過濾及增強(qiáng)、模型預(yù)訓(xùn)練和精調(diào)自適應(yīng)比例混合、人工和自動(dòng)評(píng)測(cè)相結(jié)合等方法對(duì)模型進(jìn)行垂直領(lǐng)域精調(diào),解決了精調(diào)中的數(shù)據(jù)質(zhì)量差、模型原有能力遺忘、模型答案出現(xiàn)幻覺、模型訓(xùn)練效率低等行業(yè)難題,使得模型答案質(zhì)量有很好的保障。
模型研發(fā)還把小型化部署作為重點(diǎn),大幅降低模型訓(xùn)練和推理成本。在商業(yè)化所需特定任務(wù)上,模型回答質(zhì)量不降低,而調(diào)用成本僅為小型化前的四百分之一,從而保障了以模型為基礎(chǔ)的產(chǎn)品在市場(chǎng)上的競(jìng)爭(zhēng)力。為解決在自然語言轉(zhuǎn)應(yīng)用程序接口(API)調(diào)用任務(wù)上模型發(fā)揮不穩(wěn)定的問題,研發(fā)團(tuán)隊(duì)還建立了專有的自然語言調(diào)用語料和指令數(shù)據(jù)集,從而實(shí)現(xiàn)了大語言模型對(duì)其他系統(tǒng)的精準(zhǔn)調(diào)用。
發(fā)布會(huì)上,上海交通大學(xué)重慶人工智能研究院還與華院計(jì)算技術(shù)(上海)股份有限公司、重慶賽迪工程咨詢有限公司、重慶譽(yù)存科技有限公司、中國(guó)移動(dòng)通信集團(tuán)重慶有限公司、北京流金歲月傳媒科技股份有限公司、重慶賽寶工業(yè)技術(shù)研究院有限公司進(jìn)行了現(xiàn)場(chǎng)簽約,將發(fā)揮各自優(yōu)勢(shì),促進(jìn)大模型技術(shù)在制造業(yè)、金融、農(nóng)業(yè)、文旅、教育、醫(yī)療、司法等場(chǎng)景落地應(yīng)用。
未來,上海交通大學(xué)重慶人工智能研究院將根據(jù)重慶主導(dǎo)產(chǎn)業(yè)布局需求,通過不斷優(yōu)化和升級(jí),將“兆言”大模型產(chǎn)品應(yīng)用到各個(gè)領(lǐng)域中,為推動(dòng)重慶數(shù)字經(jīng)濟(jì)的發(fā)展和助力西部(重慶)科學(xué)城的建設(shè)做出貢獻(xiàn)。