吳進(jìn) 馮劭華 張展 昝棟
摘 要:海洋科技名詞規(guī)范化工作對(duì)于海洋科學(xué)研究具有重要意義。文章通過(guò)將海洋科技名詞規(guī)范化的工作方面與ChatGPT的技術(shù)要點(diǎn)進(jìn)行結(jié)合分析,探討ChatGPT在海洋科技名詞規(guī)范化工作中的應(yīng)用前景,探究應(yīng)用困境,并給出應(yīng)用建議。
關(guān)鍵詞:海洋科技名詞規(guī)范化 ChatGPT 應(yīng)用
中圖分類號(hào):H083;TP391.1? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1004-4914(2023)06-227-02
一、引言
2022年11月30日,美國(guó)OpenAI公司發(fā)布了一款聊天機(jī)器人程序ChatGPT。ChatGPT作為AIGC人工智能生成內(nèi)容技術(shù)突破式發(fā)展的產(chǎn)物,憑借技術(shù)優(yōu)勢(shì)迅速風(fēng)靡全球。2023年3月15日,基于GPT-4的最新版ChatGPT正式推出,性能進(jìn)一步提升。面對(duì)高科技發(fā)展成果,國(guó)家有關(guān)部門于2023年7月10日聯(lián)合發(fā)布了《生成式人工智能服務(wù)管理暫行辦法》[1](以下簡(jiǎn)稱《暫行辦法》),《暫行辦法》第五條明確指出:“鼓勵(lì)生成式人工智能技術(shù)在各行業(yè)、各領(lǐng)域的創(chuàng)新應(yīng)用,生成積極健康、向上向善的優(yōu)質(zhì)內(nèi)容,探索優(yōu)化應(yīng)用場(chǎng)景,構(gòu)建應(yīng)用生態(tài)體系?!备餍袠I(yè)領(lǐng)域積極響應(yīng)政策號(hào)召,紛紛開(kāi)展學(xué)習(xí)研究,探討ChatGPT如何影響自身發(fā)展。
按照學(xué)科門類進(jìn)行科技名詞的規(guī)范化建設(shè)和推廣,對(duì)相關(guān)學(xué)科的建設(shè)發(fā)展具有重要意義。科技名詞反映著科學(xué)研究的成果,且具有很強(qiáng)的時(shí)代性特征。近些年,隨著經(jīng)濟(jì)的發(fā)展、科技的進(jìn)步和研究的開(kāi)展,海洋科學(xué)研究的深度和廣度都在不斷拓展,相關(guān)科技成果不斷涌現(xiàn),出現(xiàn)了大量新的海洋科技名詞。習(xí)近平總書(shū)記強(qiáng)調(diào):“發(fā)展海洋經(jīng)濟(jì)、海洋科研是推動(dòng)我們強(qiáng)國(guó)戰(zhàn)略很重要的一個(gè)方面,一定要抓好?!?007年出版發(fā)行的《海洋科技名詞》(第二版)亟需進(jìn)行補(bǔ)充修訂工作,以適應(yīng)海洋科學(xué)學(xué)科建設(shè)發(fā)展工作,這也是服務(wù)海洋強(qiáng)國(guó)建設(shè)的應(yīng)有之義。本文旨在探討海洋科技名詞規(guī)范化工作應(yīng)用ChatGPT的前景和困境,并給出應(yīng)用建議,以期利用科技發(fā)展成果賦能海洋科技名詞規(guī)范化工作,促進(jìn)科技名詞規(guī)范化工作在新時(shí)代、新征程不斷高質(zhì)量發(fā)展。
二、海洋科技名詞規(guī)范化應(yīng)用ChatGPT的前景
作為人工智能生成內(nèi)容技術(shù)突破式發(fā)展的代表性成果,ChatGPT自身具備諸多技術(shù)優(yōu)點(diǎn),結(jié)合海洋科技名詞規(guī)范化工作特點(diǎn)進(jìn)行分析,ChatGPT可在如下兩大方面賦能科技名詞規(guī)范化工作。
(一)ChatGPT賦能海洋科技名詞提取
1.協(xié)助處理海量文獻(xiàn)?!白匀豢茖W(xué)的成果是概念”[2]“科學(xué)認(rèn)識(shí)的成果都是通過(guò)制定各種概念來(lái)加以總結(jié)和概括的。”[2]自2007年《海洋科技名詞》(第二版)出版發(fā)行以來(lái),海洋科技領(lǐng)域的科學(xué)研究迅速發(fā)展,大量新技術(shù)、新設(shè)備和新研究方法不斷涌現(xiàn)并被應(yīng)用于科研過(guò)程中,科研成果大量出版發(fā)表,其中,海洋科學(xué)領(lǐng)域的SCI發(fā)文量逐年攀升??茖W(xué)家、學(xué)者通過(guò)科學(xué)抽象和創(chuàng)造性思維,不斷總結(jié)形成新的科學(xué)理論。海洋科技名詞規(guī)范化的一項(xiàng)重要基礎(chǔ)性工作就是對(duì)相關(guān)科研論文進(jìn)行大量收集,根據(jù)文獻(xiàn)內(nèi)容提取主要主題詞。高質(zhì)量的海洋科技名詞規(guī)范化工作需要做好文獻(xiàn)的深度閱讀工作,文獻(xiàn)閱讀質(zhì)量的高低與工作人員的學(xué)科知識(shí)背景和閱讀精細(xì)度密切相關(guān)。海量的文獻(xiàn)與有限的人力之間的矛盾成為科技名詞規(guī)范化工作無(wú)法回避的主要矛盾之一。
ChatGPT作為一款聊天機(jī)器人程序,在自然語(yǔ)言處理技術(shù)上實(shí)現(xiàn)了突破式發(fā)展運(yùn)用,實(shí)現(xiàn)了自然語(yǔ)言處理的技術(shù)飛躍[3],用戶與ChatGPT進(jìn)行交流時(shí)甚至覺(jué)察不到正在與機(jī)器對(duì)話[4]。同時(shí),經(jīng)過(guò)良好預(yù)訓(xùn)練的ChatGPT具備優(yōu)秀的總結(jié)生成能力,且GPT-4模型的文字處理能力較GPT-3.5大幅提升,上述兩大技術(shù)優(yōu)勢(shì)可以極大賦能文獻(xiàn)閱讀工作。工作人員只需將收集好的海洋科技類文獻(xiàn)輸入ChatGPT,ChatGPT即可對(duì)海洋科技領(lǐng)域的專業(yè)術(shù)語(yǔ)進(jìn)行識(shí)別,并通過(guò)學(xué)習(xí)和分析大量的海洋科技文獻(xiàn),理解海洋科技主題詞的使用方式和語(yǔ)境,從而生成并輸出相關(guān)規(guī)范化的主題詞信息。
2.ChatGPT賦能多語(yǔ)種文獻(xiàn)信息處理。目前OpenAI尚未明確公布ChatGPT掌握的語(yǔ)種數(shù)量。但是,通過(guò)OpenAI官方網(wǎng)站公開(kāi)的相關(guān)信息可以確認(rèn)ChatGPT至少掌握了26種語(yǔ)言[5]。高質(zhì)量的海洋科技文獻(xiàn)以SCI收錄文獻(xiàn)為主,輔之部分中文、德語(yǔ)、法語(yǔ)等其他語(yǔ)種文獻(xiàn)。多語(yǔ)種文獻(xiàn)的人工處理嚴(yán)重依賴于工作人員的第二語(yǔ)言素養(yǎng),語(yǔ)言不通的情形下,無(wú)法有效提取文獻(xiàn)主題詞信息。ChatGPT具備的多語(yǔ)種優(yōu)勢(shì)可以有效賦能多語(yǔ)種的海洋科技文獻(xiàn)處理工作,使海洋科技名詞規(guī)范化工作無(wú)需受制于工作人員的第二語(yǔ)言素養(yǎng)。
(二)ChatGPT賦能海洋科技名詞推廣宣傳
海洋科技名詞規(guī)范化的一個(gè)重要作用是統(tǒng)一學(xué)術(shù)詞匯表達(dá),避免各科研人員使用不同的學(xué)術(shù)表述,從而利于學(xué)術(shù)交流。如何做好海洋科技名詞的推廣宣傳工作,確??蒲腥藛T了解、掌握并使用規(guī)范化的海洋科技名詞具有重要的現(xiàn)實(shí)意義。ChatGPT可以從兩大方面助力海洋科技名詞推廣宣傳工作。一是可以借助ChatGPT生成推廣宣傳文案。海洋科技名詞規(guī)范化工作完成后,工作成果不能束之高閣,面向廣大科研工作者的推廣宣傳工作隨即成為工作重點(diǎn)?;诟哔|(zhì)量預(yù)訓(xùn)練的ChatGPT具備出色的文字生成能力,可以幫助相關(guān)管理部門生成行之有效、特色鮮明的推廣文案,助力海洋科技名詞規(guī)范化工作成果的宣傳推廣。二是助力海洋科技名詞普及。將規(guī)范化的海洋科技名詞輸入ChatGPT進(jìn)行針對(duì)性訓(xùn)練,可以讓ChatGPT掌握最新的海洋科技名詞。基于ChatGPT龐大的用戶數(shù)量,ChatGPT在回答用戶海洋科技領(lǐng)域的提問(wèn)時(shí)使用標(biāo)準(zhǔn)有效的主題詞進(jìn)行信息組織輸出的過(guò)程也是將主題詞廣泛推廣普及的過(guò)程。同時(shí),ChatGPT還可以對(duì)用戶輸入的信息進(jìn)行非標(biāo)準(zhǔn)術(shù)語(yǔ)的識(shí)別和糾正,從而幫助科研人員避免使用不準(zhǔn)確或非標(biāo)準(zhǔn)的術(shù)語(yǔ),這也是將最新的海洋科技名詞進(jìn)行有效宣傳推廣的途徑。
三、海洋科技名詞規(guī)范化應(yīng)用ChatGPT的困境
ChatGPT在憑借技術(shù)優(yōu)勢(shì)賦能海洋科技名詞規(guī)范化的同時(shí),還因自身存在的技術(shù)缺陷給海洋科技名詞規(guī)范化工作應(yīng)用ChatGPT帶來(lái)一定的挑戰(zhàn)。
(一)信息安全與保護(hù)問(wèn)題
2023年4月28日,中共中央政治局召開(kāi)會(huì)議,會(huì)議提出要重視通用人工智能技術(shù)的發(fā)展,并防范風(fēng)險(xiǎn)[6]。海洋科技名詞規(guī)范化工作應(yīng)用ChatGPT也存在信息安全與保護(hù)的風(fēng)險(xiǎn)。相關(guān)管理部門將新版海洋科技名詞輸入ChatGPT后,基于ChatGPT的RLHF人類反饋強(qiáng)化學(xué)習(xí)訓(xùn)練方式,仍存在用戶惡意調(diào)試、誤導(dǎo)ChatGPT的可能。被誤導(dǎo)后的ChatGPT會(huì)給海洋科技名詞的推廣、普及工作帶來(lái)負(fù)面消極影響。應(yīng)用ChatGPT進(jìn)行海量文獻(xiàn)處理的過(guò)程中亦存在不合理提取不特定組織或個(gè)人信息,并在后續(xù)信息生成過(guò)程中被不合理使用的問(wèn)題。
(二)信息準(zhǔn)確性
有學(xué)者指出,“人的難題對(duì)于人工智能來(lái)說(shuō)很容易,人的簡(jiǎn)單問(wèn)題對(duì)人工智能來(lái)說(shuō)很難。”莫拉維克悖論在ChatGPT上依然成立[7]。對(duì)于1000是否大于1062這樣的簡(jiǎn)單數(shù)理邏輯問(wèn)題,ChatGPT仍會(huì)給出錯(cuò)誤回答[7]。這一技術(shù)缺陷存在投射到海洋科技名詞規(guī)范化工作中的可能性,造成ChatGPT在生成海洋科技名詞時(shí)出現(xiàn)錯(cuò)誤或不準(zhǔn)確的情況。
四、海洋科技名詞規(guī)范化應(yīng)用ChatGPT的建議
(一)打造定制化的海洋科技名詞規(guī)范化ChatGPT
定制化的用于海洋科技名詞規(guī)范化工作的ChatGPT可以從兩方面著手,一是構(gòu)建海洋科技名詞專題語(yǔ)料庫(kù)?!逗Q罂萍济~》已發(fā)行2版,目前已積累了大量標(biāo)準(zhǔn)化的海洋科技主題詞,將現(xiàn)有的海洋科技名詞匯集成專題訓(xùn)練語(yǔ)料庫(kù)在技術(shù)上是可行的。專業(yè)化的語(yǔ)料庫(kù)可以對(duì)大語(yǔ)言模型進(jìn)行針對(duì)性訓(xùn)練。二是進(jìn)行定制化預(yù)訓(xùn)練。定制化預(yù)訓(xùn)練需要聯(lián)手研發(fā)企業(yè),各自發(fā)揮專長(zhǎng)進(jìn)行訓(xùn)練模型的設(shè)計(jì)和研發(fā)?;趯n}語(yǔ)料庫(kù)和專業(yè)預(yù)訓(xùn)練的ChatGPT會(huì)更加適合處理海洋科技領(lǐng)域的大規(guī)模數(shù)據(jù)和信息,用于生成海洋科技名詞時(shí)具備更高的可靠性。
(二)結(jié)合專家審核,提高海洋科技名詞規(guī)范化質(zhì)量
ChatGPT可以提供自動(dòng)化處理海洋科技信息和生成海洋科技名詞功能,將ChatGPT應(yīng)用到海洋科技名詞提取工作中可以顯著提高主題詞規(guī)范化工作效率。但是目前的ChatGPT仍存在一定的技術(shù)不足,在處理一些復(fù)雜語(yǔ)境,識(shí)別用戶隱含意圖方面,仍存在一定誤差和不準(zhǔn)確的可能。將專家復(fù)審融入海洋科技名詞規(guī)范化工作體系,可以糾正人工智能的錯(cuò)誤,提高海洋科技名詞規(guī)范化工作質(zhì)量。
(三)構(gòu)造合理的監(jiān)管體系
2023年8月15日之前,我國(guó)尚未出臺(tái)監(jiān)管人工智能生成內(nèi)容技術(shù)的法律法規(guī),對(duì)于人工智能生成內(nèi)容的監(jiān)管更多依靠行業(yè)自律及參照現(xiàn)行的法律法規(guī)規(guī)定。8月15日之后,《暫行辦法》正式生效,《暫行辦法》對(duì)生成式人工智能服務(wù)提出了分類分級(jí)監(jiān)管的要求,并對(duì)提供和使用生成式人工智能服務(wù)應(yīng)遵守的方面給出了五條具體規(guī)定。多元化的監(jiān)管體系除了政策和法規(guī)外,還應(yīng)考慮其他方面:一是開(kāi)發(fā)和使用先進(jìn)的技術(shù)手段和算法監(jiān)控工具,對(duì)人工智能生成內(nèi)容的過(guò)程進(jìn)行實(shí)施跟蹤,以及時(shí)發(fā)現(xiàn)和糾正生成內(nèi)容中可能存在的問(wèn)題和錯(cuò)誤。二是加強(qiáng)公眾教育?!稌盒修k法》明確鼓勵(lì)生成式人工智能技術(shù)在各行業(yè)領(lǐng)域的創(chuàng)新應(yīng)用,探索優(yōu)化應(yīng)用場(chǎng)景,構(gòu)建應(yīng)用生態(tài)體系。未來(lái)生成式人工智能會(huì)更加融入生活場(chǎng)景,公眾是否具備良好的信息素養(yǎng)成為生成式人工智能能否有效發(fā)揮效用的關(guān)鍵。通過(guò)多種手段加強(qiáng)公眾信息素養(yǎng),提高公眾對(duì)人工智能生成內(nèi)容的判斷、評(píng)價(jià)能力,可以讓生成式人工智能技術(shù)更好地為人民所用。三是加強(qiáng)合作。企業(yè)、行業(yè)組織、教育和科研機(jī)構(gòu)、公共文化機(jī)構(gòu)、有關(guān)專業(yè)機(jī)構(gòu)等應(yīng)在生成式人工智能風(fēng)險(xiǎn)防范方面開(kāi)展密切協(xié)作,發(fā)揮各自優(yōu)勢(shì),將應(yīng)用風(fēng)險(xiǎn)降到最低。
五、結(jié)語(yǔ)
科技浪潮呼嘯而至,科學(xué)技術(shù)是第一生產(chǎn)力。面對(duì)新科技發(fā)展成果,可取的做法是積極加強(qiáng)研究,深入探討新技術(shù)是否可以融入并賦能各自的業(yè)務(wù)領(lǐng)域。海洋科技名詞規(guī)范化作為眾多業(yè)務(wù)領(lǐng)域之一,面對(duì)ChatGPT這一生成式人工智能技術(shù)最新發(fā)展成果,無(wú)疑也需要加強(qiáng)融合研究,以期在新時(shí)代利用新技術(shù)發(fā)展成果賦能海洋科技名詞規(guī)范化工作高質(zhì)量發(fā)展,為中國(guó)式現(xiàn)代化新征程上我國(guó)海洋科技事業(yè)發(fā)展貢獻(xiàn)力量。
參考文獻(xiàn):
[1] 生成式人工智能服務(wù)管理暫行辦法.[EB/OL].[2023-8-1].https://www.gov.cn/zhengce/zhengceku/202307/content_6891752.htm.
[2] 吳篤卿.科技名詞規(guī)范化的重要意義[J].中國(guó)科技術(shù)語(yǔ).
[3] 朱光輝,王喜文.ChatGPT的運(yùn)行模式、關(guān)鍵技術(shù)及未來(lái)圖景[J].新疆師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2023,44(04).
[4] 徐繼敏,嚴(yán)若冰.論大語(yǔ)言模型材料的證據(jù)屬性——以ChatGPT和文心一言為例[J].四川師范大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)
[5] OPENAI.GPT-4[EB/OL].[2023-8-1].https://openai.com/resea
rch/gpt-4.
[6] 新華社.中共中央政治局召開(kāi)會(huì)議分析研究當(dāng)前經(jīng)濟(jì)形勢(shì)和經(jīng)濟(jì)工作,中共中央總書(shū)記習(xí)近平主持會(huì)議[EB/OL].[2023-8-1].https://www.gov.cn/yaowen/2023-04/28/content_5753652.htm.
[7] ZHOU J, KE P, QIU X, et al. ChatGPT: potential, prospects, and limitations[J].Frontiers of information technology & electronic engineering,2023.
[基金項(xiàng)目:中央高?;究蒲袠I(yè)務(wù)經(jīng)費(fèi)“基于科技論文的海洋科技名詞整理與篩選研究”(項(xiàng)目號(hào):202364012)]
(責(zé)編:若佳)