[摘要]ChatGPT的火爆問世引起了出版行業(yè)對自然語言處理技術的熱切關注。文章在深入分析自然語言處理技術對學術期刊出版影響的基礎上,進一步采用SWOT分析法對我國學術期刊出版的優(yōu)勢與劣勢、面臨的機遇與挑戰(zhàn)進行剖析,提出學術期刊智能化轉型發(fā)展的策略:緊抓機遇,深化體制改革和資源整合;加強技術合作,建設智能化綜合出版平臺;加速建立監(jiān)管體系,保障智能出版健康發(fā)展;精準匹配供需,提供本土化服務模式;加強人才隊伍建設,提高智能化發(fā)展競爭力。
[關鍵詞]自然語言處理技術;ChatGPT;人工智能;學術期刊;智能出版
自然語言處理技術(Natural Language Processing,NLP)是人工智能(Artificial Intelligence,AI)的重
要技術手段之一,它基于機器學習算法對人類語言進行語言分析、理解、生成等。作為NLP技術的杰出代表,由美國OpenAI公司開發(fā)的智能聊天機器人ChatGPT(Chat Generative Pre-trained Transformer)
自2022年11月30日正式推出以來,便憑借出色的語言理解和生成能力在全球范圍內引起了廣泛關注和激烈討論。隨著信息時代的到來和人工智能技術的迅猛發(fā)展,國際出版行業(yè)巨頭正在人工智能的賽道上積極謀篇布局,如何推動國內學術期刊出版的智能化轉型并在新的賽道上實現(xiàn)追趕甚至超越,成為近年來出版研究的熱點[1-2]。如今,ChatGPT取得了自然語言處理領域的顛覆性技術突破,作為與人類語言聯(lián)系最密切的行業(yè)之一,出版業(yè)將面臨怎樣的變革和影響,以及我國學術期刊的智能化發(fā)展策略,成為業(yè)內人士關注的問題[3]。
文章針對NLP技術對學術期刊出版的影響展開分析,并采用SWOT分析法對我國學術期刊發(fā)展的優(yōu)劣勢以及外部環(huán)境的機會和挑戰(zhàn)進行剖析,探索我國學術期刊出版的智能化發(fā)展策略,為學術出版在新技術背景下實現(xiàn)高質量創(chuàng)新發(fā)展提供參考。
一、NLP技術對學術期刊出版的影響
(一)優(yōu)化學術內容生產(chǎn)的效率與質量
NLP技術能夠識別詞匯、理解語法、解釋語義、推斷邏輯關系等,學術期刊編輯不僅可以使用NLP技術根據(jù)論文內容生成摘要、標題和關鍵詞,對語法、語義和篇章結構等進行多維度檢查、質量評估和潤色加工,為內容編校提供參考和建議,減少人工編校的工作量和錯誤,還可以根據(jù)不同的發(fā)行形式進行智能排版并協(xié)助處理各種常見的排版格式問題,大幅度提高學術內容生產(chǎn)的效率與質量,從而更多地關注學術內容價值的評估工作及創(chuàng)新性的出版工作。
(二)增強學術評價的科學性和有效性
隨著學科分類的細化和專業(yè)領域的延伸,學術研究的專業(yè)化趨勢日漸顯著,不同研究方向之間壁壘分明。研究方向有偏差的審稿人提出的審稿意見可能會受到嚴謹性和專業(yè)性的質疑,審稿人也可能因專業(yè)偏差謝絕評審而耽誤審稿周期。對此,學術期刊編輯可以采用NLP技術自動匹配科研方向吻合的審稿人,并為審稿人提供快速、優(yōu)質的評審參考意見,從而增強論文評審的科學性和有效性。
(三)提高期刊傳播能力和知識服務水平
學術期刊編輯可以利用NLP技術基于論文生成個性化的推送文本、宣傳海報甚至視頻,輔助新媒體內容創(chuàng)作和期刊宣傳。同時,學術期刊編輯也可以利用NLP技術對學術論文進行高質量的多語種智能翻譯,使非英語期刊也能達到國際傳播的效果。此外,學術期刊編輯還可以利用NLP技術,根據(jù)讀者歷史閱讀記錄、閱讀需求等進行個性化分析,有針對性地為讀者提供文獻推薦、學科前沿熱點和問題解決方案等,幫助讀者高效、準確地獲取學術信息,隨時向讀者提供互動交流服務,提高期刊服務水平。
二、NLP技術背景下我國學術期刊發(fā)展SWOT
分析
NLP技術深入、廣泛地嵌入學術期刊出版的各個環(huán)節(jié)已成為未來發(fā)展的重要趨勢。在此背景下,對我國學術期刊發(fā)展的內外部競爭條件和競爭環(huán)境展開深入的態(tài)勢分析并采取前瞻性的應對策略,是確保我國學術期刊在科技變革中實現(xiàn)創(chuàng)新發(fā)展的關鍵。
(一)優(yōu)勢
1.數(shù)據(jù)資源和基礎設備
數(shù)據(jù)是人工智能應用的基礎,學術期刊掌握數(shù)據(jù)資源才能占據(jù)人工智能技術的高地。我國具有科研大國的優(yōu)勢,豐富的科技論文資源為開展與人工智能出版相關的應用研究提供了豐富的數(shù)據(jù)和有利條件。同時,面對超大型模型所需要的龐大算力需求,國內已建立包括天津中心、廣州中心、長沙中心等在內的10個國家超級計算中心以及多個人工智能計算中心,為我國人工智能自主創(chuàng)新發(fā)展提供了充分保障。
2.科研市場
2022年,我國研發(fā)人員總量超過600萬人,連續(xù)多年保持世界第一。豐富的人才資源不僅為學術期刊智能化發(fā)展提供了可靠的人才基礎,而且意味著產(chǎn)生龐大的學術論文發(fā)表和文獻信息獲取需求,這些都為我國學術出版智能化轉型提供了巨大的市場潛力和廣闊的發(fā)展空間。
(二)劣勢
1.期刊體制問題
國內學術期刊呈現(xiàn)“散、小、弱”以及非市場化的特點。首先,小眾、分散的期刊運營模式不利于AI數(shù)據(jù)的獲取和處理。NLP等人工智能技術的進一步發(fā)展需要大量數(shù)據(jù)進行訓練和迭代,而國內學術期刊之間的數(shù)據(jù)、規(guī)范等彼此獨立,使人工智能對數(shù)據(jù)的獲取和處理有一定的限制和難度,不利于人工智能技術在學術期刊出版中的使用。其次,發(fā)展智能出版對算力的要求很高,而我國學術期刊出版單位市場化和集約化程度相對較低,計算資源和經(jīng)費支撐有限,進行學術研究和應用開發(fā)的困難較大。最后,國內部分學術期刊在運營體制、服務模式、人才隊伍建設等方面的創(chuàng)新不足,缺乏期刊改革發(fā)展的內生動力和市場化競爭意識。這些劣勢可能會加大我國學術期刊與國際一流期刊在智能化發(fā)展中的差距。
2.人才缺失
隨著人工智能技術在學術出版領域的不斷深入應用,學術期刊出版單位需要一支有學術出版經(jīng)驗且具備人工智能信息技術素養(yǎng)的人才隊伍,要求相關人員能夠理解并利用人工智能技術實施與學術出版相關的算法應用,為學術出版流程提供技術支持。然而,國內的人工智能技術起步相對較晚,學術期刊編輯對AI技術的了解和應用較為缺乏。這可能導致他們無法全面了解AI技術的應用場景和優(yōu)勢,并將其有效應用于實際工作。
(三)機會
1.國家政策引導
2017年7月,國務院印發(fā)《新一代人工智能發(fā)展規(guī)劃》,確定人工智能發(fā)展分三步走的戰(zhàn)略目標;同年12月,工信部印發(fā)《促進新一代人工智能產(chǎn)業(yè)發(fā)展三年行動計劃(2018—2020年)》,推動人工智能技術研發(fā)和產(chǎn)業(yè)化發(fā)展;2019年8月,科技部等六部門印發(fā)《關于促進文化和科技深度融合的指導意見》,為出版行業(yè)與人工智能的高度融合提供了良好的政策保障;同月,中國科協(xié)、中宣部、教育部、科技部聯(lián)合印發(fā)《關于深化改革 培育世界一流科技期刊的意見》,明確提出我國科技期刊的發(fā)展目標是期刊綜合實力進入世界第一方陣;2022年4月,中共中央宣傳部印發(fā)了《關于推動出版深度融合發(fā)展的實施意見》,指出要立足擴大優(yōu)質內容供給、創(chuàng)新內容呈現(xiàn)傳播方式、打造重點領域內容精品……充分發(fā)揮技術對出版融合發(fā)展的支撐作用。一系列國家政策的出臺表明,人工智能作為基礎技術在文化出版等行業(yè)的開發(fā)應用備受重視,也從宏觀層面為構建適用于中國的智能出版模式提供了良好的政策引導和社會環(huán)境。
2.市場需求驅動
隨著我國科研人員數(shù)量的增加和研究水平的不斷提高,研究人員需要獲取更多、更全面的科研信息支持研究工作,面對海量的學術信息內容,科研成果的產(chǎn)出也越來越倚重文獻信息資源的高效獲取、傳播與科學分析。NLP技術改變了文獻信息資源的獲取、傳播與分析方式,科研人員可以從海量的學術文獻數(shù)據(jù)中挖掘特定研究領域的學術信息,獲得更加精準、高效和個性化的科研信息內容并加以分析整合。我國旺盛的科研市場需求為促進人工智能嵌入學術期刊發(fā)展提供了重要驅動。
3.行業(yè)技術推動
目前,我國互聯(lián)網(wǎng)龍頭企業(yè)已積極投入NLP技術的開發(fā)和應用,并取得一定進展。例如:2021年哈爾濱工業(yè)大學和科大訊飛聯(lián)合研發(fā)的中文預訓練語言模型BERT-wwm(whole word masking)[4]在多個中文測試集上表現(xiàn)優(yōu)異,部分效果甚至超過了原版BERT模型,彌補了之前該研究模型在中文自然語言處理上的不足;百度公司開發(fā)的NLP項目“文心一言”(ERNIE Bot)于2023年3月面向公眾開放,該模型將大數(shù)據(jù)預訓練與多源知識相結合,通過持續(xù)學習不斷提高模型的表現(xiàn)能力;華為、騰訊和阿里公司分別提出的“盤古”“混元”和“通義千問”三大NLP模型的參數(shù)規(guī)模均達到千億甚至萬億級。國內企業(yè)在NLP領域的不斷發(fā)展為AI技術在學術出版中的創(chuàng)新應用和深入發(fā)展提供了技術基礎和保障。
(四)挑戰(zhàn)
1.制度標準缺失
學術期刊使用NLP技術生成的內容可能存在不實、抄襲現(xiàn)象,由此產(chǎn)生的知識產(chǎn)權和責任風險的歸屬問題尚不明確,而在進行信息推送傳播時,可能進一步構成對原作品人版權和傳播權的侵權行為[5],因此包括《科學》《自然》等在內的部分學術期刊已明令禁止或限制其作者使用ChatGPT等NLP模型。目前,我國學術出版界還沒有關于作者使用NLP等人工智能技術的明確規(guī)定或標準??梢灶A見的是,未來采用人工智能進行的研究或以人機結合的方式撰寫的文本可能越來越常見,學術出版界應積極著手研究和制訂人工智能在應用中可能引發(fā)的各種侵權和責任問題及相應的制度標準。此外,NLP模型需要的大量訓練數(shù)據(jù),不僅包括作者、讀者等個人隱私,還可能涉及國家政策及基金專利等敏感信息,若數(shù)據(jù)被竊取或濫用,會對數(shù)據(jù)安全造成重大威脅。
2.科技出版競爭加劇
NLP技術作為備受關注的國際前沿技術,各個行業(yè)巨頭對其正在爭先籌措。例如:Springer Nature公司已利用該技術在SpringerLink平臺上為用戶提供文獻推薦和搜索體驗;Elsevier公司的Scopus數(shù)據(jù)庫使用NPL技術進行文章的自動標記和分類,幫助用戶更輕松地查找、篩選和評估學術文章。國外大型學術出版商在機器學習和自然語言處理技術方面的持續(xù)投入和開發(fā)應用,可能進一步擴大我國在知識傳播和學術出版方面的現(xiàn)有差距,加劇出版行業(yè)的市場競爭及目前學術出版的不平等。
三、我國學術期刊智能化發(fā)展策略
為了貫徹落實建設世界一流學術期刊的規(guī)劃要求,順應出版行業(yè)與人工智能技術深度融合的發(fā)展趨勢,根據(jù)以上SWOT分析,我國學術期刊可從以下方面高效推進智能化發(fā)展。
(一)緊抓機遇,深化體制改革和資源整合
我國現(xiàn)有的學術期刊體制模式在一定程度上與市場發(fā)展需求不相適應,且期刊數(shù)量多、資源散、市場化程度低、體制改革難度大[6]。人工智能為我國學術出版發(fā)展帶來挑戰(zhàn)的同時,也為其進行體制結構調整、出版資源整合、運營機制創(chuàng)新提供了新的契機。學術期刊要在挑戰(zhàn)中抓機遇,在變局中開新局,將行業(yè)競爭壓力轉化為改革創(chuàng)新動力,牢牢把握好培育世界一流科技期刊、促進人工智能產(chǎn)業(yè)發(fā)展、推動出版深度融合發(fā)展等機會,充分發(fā)揮人工智能技術優(yōu)勢,創(chuàng)新編輯出版、學術評價、知識服務等模式。在人工智能新賽道上,學術期刊要加快落實轉體改制的步伐,組建具有學術品牌影響力和綜合發(fā)展實力的學術出版集團公司,依托優(yōu)質學術資源或優(yōu)勢出版平臺,通過合作辦刊、平臺加盟、全流程托管等多種辦刊模式實現(xiàn)期刊集群化發(fā)展[7],改變各學術出版單位資源割裂和重復建設的狀態(tài),充分整合資源,實現(xiàn)互促發(fā)展。
(二)加強技術合作,建設智能化綜合出版平臺
學術期刊必須加強與人工智能技術企業(yè)的技術合作,通過引入第三方服務或其他技術服務商的服務產(chǎn)品或技術優(yōu)勢來解決自身人力和資金不足的問題,打造集組稿約稿、投稿審稿、內容加工、編校排版、發(fā)布傳播、信息推送、知識服務于一體的綜合智能學術出版平臺,推動學術期刊智能化發(fā)展。例如:2022年,Springer Nature公司收購了Research Square公司,該公司的子公司AJE (美國期刊專家)可提供一流人工智能驅動的作者解決方案;2023年,該公司宣布收購創(chuàng)新的數(shù)字化寫作輔助工具TooWrite,為研究人員提供寫作引導和數(shù)字化解決方案。
(三)加速建立監(jiān)管體系,保障智能出版健康發(fā)展
NLP技術給學術出版賦能的同時也帶來風險與責任隱患。人工智能領域的標準化、制度化建設是AI嵌入學術出版亟待解決的問題。近年來,我國在加速建立AI監(jiān)管法規(guī)方面取得一定進展:2019年5月,國內多所研究機構和高校聯(lián)合發(fā)布了《人工智能北京共識》,提出人工智能研發(fā)、使用和治理方面的諸項社會意識導向性原則;2021年11月,《中華人民共和國個人信息保護法》正式實施,與《中華人民共和國網(wǎng)絡安全法》《中華人民共和國數(shù)據(jù)安全法》一同奠定了我國人工智能監(jiān)管法律體系的基礎。此外,我國還要加快出臺人工智能相關的法律法規(guī),制定人工智能在出版領域的標準體系和制度規(guī)范,如專門的人工智能審核和監(jiān)管機構、可區(qū)分原創(chuàng)與人工智能技術合成品的溯源系統(tǒng),以及人工智能侵權行為責任認定等,保障我國學術期刊應用人工智能出版的健康有序發(fā)展。
(四)精準匹配供需,提供本土化服務模式
國際學術出版集團的人工智能應用,在我國科研市場可能存在不適應的問題。這是因為國外NLP技術的開發(fā)主要基于他國的語言數(shù)據(jù)庫,對中文數(shù)據(jù)的訓練和表達效果較弱。我國科研工作者數(shù)量龐大、專業(yè)研究范圍廣、對中文科研服務和學術出版的需求大,因此,學術期刊的智能化發(fā)展要從國內科研工作者需求出發(fā),精準匹配供需,構建智能化、個性化、本土化的學術服務創(chuàng)新模式。學術期刊也要利用自然語言處理技術和數(shù)據(jù)挖掘技術,對國內學術資源內容進行抓取、分析和重建,并做好與國外重要期刊數(shù)據(jù)庫、學術社交平臺和學術搜索引擎的對接工作,竭力滿足國內用戶的個性化學術服務需求。
(五)加強人才隊伍建設,提高智能化發(fā)展競爭力
雖然現(xiàn)在AI已基本勝任出版過程中校對、排版等創(chuàng)新性較低的工作,甚至可完成部分學術評估任務,如論文完整性審查、審稿人的選擇等,但是基于已有數(shù)據(jù)的機械邏輯算法,其仍無法實現(xiàn)創(chuàng)新并對學術創(chuàng)新性進行前瞻性評估。因此,在科研學術的創(chuàng)造性發(fā)展及其評價活動中,人工智能無法完全替代人類的角色。對此,學術期刊編輯要做好知識把關人,在不斷提高專業(yè)學術素養(yǎng)和出版業(yè)務能力的同時,也要具備較高的計算機信息素養(yǎng)、全媒體傳播能力等。目前,人才尤其是復合型人才,仍是人工智能技術背景下學術期刊的核心競爭力。為此,學術期刊要重視對復合型編輯人才的引進和培養(yǎng),創(chuàng)建尊重個體價值和貢獻的工作環(huán)境,實行開放、積極的人才引進政策,以吸引高素質的復合型編輯人才助力學術期刊的智能化發(fā)展。同時,學術期刊也要積極制訂切實可行的人才培養(yǎng)計劃,如激勵政策、暢通轉型和晉升通道等,鼓勵現(xiàn)有編輯主動提升智能化技術能力,幫助其成長為具備人工智能綜合素養(yǎng)的復合型編輯,從而提高我國學術期刊智能化發(fā)展的競爭力。
四、結語
NLP技術為學術期刊智能化發(fā)展提供了強大的技術支撐,同時引發(fā)了國際學術出版界的新一輪激烈競爭。我國學術期刊應采取一系列策略,包括緊抓機遇,深化體制改革和資源整合;加強技術合作,建設智能化綜合出版平臺;加速建立監(jiān)管體系,保障智能出版健康發(fā)展;精準匹配供需,提供本土化服務模式;加強人才隊伍建設,提高智能化發(fā)展競爭力,以推動我國學術期刊在人工智能技術變革中實現(xiàn)跨越式的新發(fā)展。
[參考文獻]
[1]向颯.人工智能對學術期刊智能化轉型與融合發(fā)展的賦能[J].出版廣角,2022(18): 81-84.
[2]范軍,陳川.人工智能在歐美學術出版領域的應用及其啟示[J].河南大學學報(社會科學版),2020(01):144-149.
[3]沈錫賓,王立磊,劉紅霞.人工智能生成內容時代學術期刊出版的機遇與挑戰(zhàn)[J].數(shù)字出版研究,2023(02):27-33.
[4]CUI Yiming, CHE Wanxiang, LIU Ting, et al. Pre-Training with Whole Word Masking for Chinese BERT[J]. IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2021(29): 3504-3514.
[5]鄧婧,何婧.智能出版視域下學術期刊技術倫理風險與責任[J].中國編輯,2022(01):55-60.
[6]秦德繼.建設世界一流科技期刊的路徑研究[J].科技傳播,2019(11):1-3.
[7]張維,冷懷明,王治,等.國內重點科技期刊群集約化管理和運營模式研究[J].出版發(fā)行研究,2022(12):52-57.
[基金項目]2023年度江蘇高校哲學社會科學研究一般項目“學術期刊智能化轉型發(fā)展策略研究” (項目編號:2023SJYB2071);揚州大學人文社會科學基金資助項目“高校綜合性科技期刊與‘雙一流’建設互促發(fā)展的意義和路徑探討”(項目編號:xjj2021-50);江蘇省期刊協(xié)會立項課題“‘雙一流’建設背景下高校科技期刊服務能力提升路徑探析”(項目編號:2022JSQKB57)。
[作者簡介]文采(1986—),女,貴州貴陽人,揚州大學學報編輯部編輯。