摘要: 語言作為一種“資源”,具有重要的經(jīng)濟屬性,能夠促成語言產(chǎn)業(yè)的形成與發(fā)展。在數(shù)字經(jīng)濟時代,語言還是數(shù)據(jù)生產(chǎn)要素的主要體現(xiàn)形式與重要組成部分,具有泛生產(chǎn)要素性質(zhì),語言數(shù)據(jù)的產(chǎn)業(yè)化趨勢催生了語言產(chǎn)業(yè)發(fā)展的新模式——語言數(shù)據(jù)產(chǎn)業(yè)。處于初創(chuàng)發(fā)展期的語言數(shù)據(jù)產(chǎn)業(yè)存在諸多問題,對此,可以從學術上加強研究、管理上加大扶持與引導、監(jiān)管上強化產(chǎn)權立法、發(fā)展上突顯鏈式思維、學習上借鑒國際經(jīng)驗等措施加以化解突破。
關鍵詞:數(shù)字經(jīng)濟;生產(chǎn)要素;語言產(chǎn)業(yè);語言數(shù)據(jù)產(chǎn)業(yè)
中圖分類號:F062.9
文獻標識碼:A文章編號:1673-4513(2023)-02-074-07
作者簡介:
毛現(xiàn)樁(1981-),男,河南平頂山人,副教授,博士,主要研究方向:語言產(chǎn)業(yè)、語言經(jīng)濟。
基金項目:
2022年河南省教育科學規(guī)劃項目“新文科背景下省屬普通本科高校外語專業(yè)產(chǎn)教融合協(xié)同育人機制研究”(2022YB0116);2022 年河南省本科高校研究性教學改革研究與實踐項目(2022SYJXLX046);河南財經(jīng)政法大學2021年教改項目“智慧教學模式下大學英語跨文化類課程線上線下混合式金課建設研究與實踐”。
引言
數(shù)字經(jīng)濟是以信息技術的革命與發(fā)展為驅(qū)動,以數(shù)據(jù)作為核心生產(chǎn)要素的新興經(jīng)濟形態(tài)。黨的十九大報告提出加快建設數(shù)字中國,指明了我國經(jīng)濟社會發(fā)展的方向。2021年11月1日,中國正式提出申請加入DEPA,標志著我國數(shù)字經(jīng)濟發(fā)展進入了新時期,具有里程碑式的重要意義。
在信息通信技術與傳統(tǒng)產(chǎn)業(yè)融合的影響下,我國的數(shù)字經(jīng)濟近年來一直呈現(xiàn)飛速發(fā)展的態(tài)勢。2021年4月,中國信息通信研究院發(fā)布《中國數(shù)字經(jīng)濟發(fā)展白皮書》,2019年我國數(shù)字經(jīng)濟規(guī)模占GDP總量的36.2%,對經(jīng)濟增長的貢獻為67.7%,2020年較2019年又提升了2.4%,占GDP總量的38.6%,數(shù)字經(jīng)濟已成為拉動我國經(jīng)濟增長的新動力。數(shù)字經(jīng)濟最核心的生產(chǎn)要素是數(shù)據(jù),而在人類觀察世界所形成的可供計算機處理的數(shù)據(jù)中,80%都是語言數(shù)據(jù),故語言數(shù)據(jù)是數(shù)字經(jīng)濟時代最為重要的數(shù)據(jù)。數(shù)字經(jīng)濟的高質(zhì)量發(fā)展有賴于語言數(shù)據(jù)的高質(zhì)量收集、挖掘、存儲、管理、加工及應用,這為語言產(chǎn)業(yè)的新發(fā)展——語言數(shù)據(jù)產(chǎn)業(yè),帶來了機遇,也提出了挑戰(zhàn)。
一、語言的經(jīng)濟學屬性與語言產(chǎn)業(yè)
(一) 語言的經(jīng)濟學屬性
語言的經(jīng)濟學屬性來源于語言的“資源”本質(zhì),語言具有一般經(jīng)濟資源的稀缺性與成本收益性。從個體層面而言,語言資源不是與生俱來,而是通過后天的成本(時間或金錢)投入逐漸習得,而且因個體與投入差異,對該資源的獲取程度因人而異。研究發(fā)現(xiàn),個體通過“成本投入”所獲得的語言能力提升程度或掌握的多語種數(shù)量與其工資收入水平和社會經(jīng)濟地位具有較強的關聯(lián)性,存在著顯著的正相關關系,語言資本投資是一種重要的人力資本投資形式。此外,作為人類認知與思維的工具,個人的語言能力很大程度上決定著其個體獲得其他人力資本(如知識、科技、技能等)的程度,從這個角度上講,語言是個體提升自身其他人力資本的一種重要的中介資本。另一方面,從國家或社會維度而言,語言的“資源”本質(zhì)體現(xiàn)在語言的文化負載性上。語言是文化的重要載體,不同語言之間或同一語言不同方言之間存在比較明顯的文化差異,文化差異會造成人與人之間的誤會、偏見乃至歧視等負面效果,從而造成交流障礙,降低交流意愿,影響地區(qū)間的經(jīng)濟互動。國家之間的“語言距離”不僅會阻礙科學技術的全球傳播,不利于技術落后國“后發(fā)優(yōu)勢”的發(fā)揮,而且還增加了貿(mào)易往來的交易成本,影響了外商投資的進入模式。綜上,語言不僅是一種能給個體帶來經(jīng)濟利益的特殊人力資本形式,而且也是一種能夠影響整個國家或民族發(fā)展的重要經(jīng)濟資源。
(二)語言產(chǎn)業(yè)及其業(yè)態(tài)發(fā)展
語言一旦有了經(jīng)濟價值,便會進入市場,開始發(fā)生經(jīng)濟行為。個體通過自學或是參加語言培訓提升了自身語言技能,在勞動力市場獲得了求職的競爭優(yōu)勢、在職場提升了工資水平,從而在語言資本中獲利;不同語言文化中的企業(yè)開展經(jīng)貿(mào)往來需要有語言翻譯服務來消除語言障礙、拉近語言距離、處理貿(mào)易摩擦等事務,從而有了語言消費需求。隨之,市場上便出現(xiàn)了語言培訓、語言翻譯、語言出版等一些專門提供語言產(chǎn)品或服務的企業(yè),當語言消費與語言供給達到一定的成熟度和規(guī)模后便形成了語言產(chǎn)業(yè)。
關于語言產(chǎn)業(yè)的內(nèi)涵,不同學者給出了不同的界定,比較具有代表性的幾個意見如下。李宇明(2016)認為“語言產(chǎn)業(yè)是以生產(chǎn)和提供語言產(chǎn)品,利用語言賺取紅利的產(chǎn)業(yè)?!标慁i(2012)認為“語言產(chǎn)業(yè)是以語言為內(nèi)容、材料,或是以語言為加工、處理對象,生產(chǎn)出各種語言產(chǎn)品以滿足各種語言需求的產(chǎn)業(yè)形態(tài)。”黃少安等(2012)認為“語言產(chǎn)業(yè)是一種采取市場化的經(jīng)營方式生產(chǎn)語言類產(chǎn)品或者語言服務,從而滿足國家或者個人對各種語言產(chǎn)品或語言服務需求的產(chǎn)業(yè)。”賀宏志(2012)認為“語言產(chǎn)業(yè)是以語言文字作為原料和內(nèi)容(語言本體),或是以語言文字作為加工處理的對象(語言作為工具),生產(chǎn)各種語言產(chǎn)品或提供各種語言服務的產(chǎn)業(yè)?!币陨蠈φZ言產(chǎn)業(yè)的界定雖各有側重,但語言產(chǎn)品的生產(chǎn)或語言服務的提供是其核心內(nèi)容。因此,根據(jù)語言產(chǎn)品或服務的形態(tài)或方式,我們可以將語言產(chǎn)業(yè)下分為三大類別:語言能力產(chǎn)業(yè)、語言內(nèi)容產(chǎn)業(yè)與語言處理產(chǎn)業(yè),又可具體化為語言培訓、語言康復、語言測評、語言出版、語言翻譯、語言創(chuàng)意、語言會展、語言文字信息處理、語言藝術等九大業(yè)態(tài)類型。
但是,隨著互聯(lián)網(wǎng)信息技術的發(fā)展與普及,尤其是近兩年受疫情影響,網(wǎng)絡空間的語言產(chǎn)業(yè)各業(yè)態(tài)所占比例越來越高,如在線語言教育與測評、在線會議翻譯、在線語言展覽、在線智能寫作、在線語音識別、合成、輸入等在線語言處理業(yè)態(tài)。網(wǎng)絡空間的語言產(chǎn)業(yè)與傳統(tǒng)語言產(chǎn)業(yè)相比最大區(qū)別在于,在網(wǎng)絡空間,計算機是以數(shù)據(jù)的形式運行處理語言內(nèi)容,從而形成新的語言產(chǎn)品或語言服務,語言數(shù)據(jù)在網(wǎng)絡空間語言產(chǎn)業(yè)中起著至關重要的作用。
二、數(shù)字經(jīng)濟中的語言數(shù)據(jù)生產(chǎn)要素
數(shù)字經(jīng)濟以信息技術發(fā)展為必要條件,以數(shù)據(jù)為關鍵的生產(chǎn)要素,用數(shù)字呈現(xiàn)信息內(nèi)容。在數(shù)字經(jīng)濟中,語言作為信息技術創(chuàng)新和互聯(lián)網(wǎng)應用創(chuàng)新的基礎要素,在很大程度上已超越語音、詞匯與語法系統(tǒng)的傳統(tǒng)范疇和語言文化差異,已超越語言思維和數(shù)據(jù)思維的傳統(tǒng)框架和戰(zhàn)略認知,成為了數(shù)字經(jīng)濟中具有戰(zhàn)略意義的數(shù)據(jù)系統(tǒng)。數(shù)字經(jīng)濟中的語言數(shù)據(jù)分為三個層級:自然語言、人工語言與數(shù)字語言。
(一)自然語言
自然語言,即語言的應然狀態(tài)。自然語言體現(xiàn)著人類交流的豐富性與多樣性。語言雖是信息的載體,但是,每一種自然語言都有其獨特的語音、詞匯、語法、文字等表意系統(tǒng)。所以,相同的信息在不同的語言系統(tǒng)中有著迥然不同的表達形式。這使得不同語言之間的信息傳遞存在障礙,亦即“語言效率”存在差異。信息交流是語言的第一屬性,但當交流的信息彼此間呈現(xiàn)標準不一致時,人們就需要通過語言學習或語言翻譯以達到交流的彼岸。
自然語言雖屬語言數(shù)據(jù)的較低形態(tài),但是語言數(shù)據(jù)的重要組成部分,并且是計算機處理語言數(shù)據(jù)中最難的一種。計算機對自然語言的處理程度,如漢字識別、語音檢索、語言(聲音、文字)翻譯、機器客服語言訓練等都決定著人工智能的發(fā)展進程。
(二)人工語言
自然語言在為人類創(chuàng)造了一個多彩語言世界的同時,也為世界范圍內(nèi)的信息交流與溝通帶來了天然的認知障礙。隨著交通工具與信息技術的進步與發(fā)展,這種障礙愈加明顯,因此,人們開始設想創(chuàng)造一種具有通用效果的“人工語言”,以掃除語言差異在認知中的障礙。在知識傳播史上,數(shù)學語言便是成功的一例。數(shù)學運算符號以及數(shù)學公式的統(tǒng)一,極大化解了自然科學知識傳播過程中的語言障礙,使得伽利略用數(shù)學語言撰寫的關于天體、宇宙的著作成為后來物理學、化學、工程設計等學科發(fā)展的重要基礎知識。有了對已有知識系統(tǒng)化和標準化的語言處理,后人可直接對接前人成果,實現(xiàn)一次又一次的技術創(chuàng)新。除了數(shù)學語言,我們還有樂譜語言、盲文、聾啞人的手語、旗語、燈語、電話號碼、銀行卡號碼等形式的人工語言。人工語言可以是自然語言的符號化,體現(xiàn)自然語言規(guī)則,也可以自成體系,擁有內(nèi)部運行規(guī)則;對人工語言的理解有時需要自然語言輔助,有時需用自然語言闡釋。總之,人工語言與自然語言具有天然的密切關系。
當今社會,經(jīng)濟發(fā)展是人類的主題,而語言是能夠影響從知識生產(chǎn)到技術創(chuàng)新再到經(jīng)濟績效的最微觀的因子,隨著計算機信息技術與互聯(lián)網(wǎng)滲入所有的經(jīng)濟行為,我們急需一種通用語言,以極高的效率進行信息流動和知識獲取,從而促進經(jīng)濟更快更好發(fā)展,這便是數(shù)字語言。
(三)數(shù)字語言
當人類大腦面對實踐對象的復雜性與豐富性時,傳統(tǒng)語言文字難以出色完成對其全面認知與深度分析加工,表現(xiàn)出了認知效率不佳。此時,一種高效的媒介技術即機器語言出現(xiàn)了,它由形式語言所形成的虛擬計算機大腦來開展我們?nèi)祟惔竽X在某些領域所完不成的工作。機器語言的發(fā)展推動了數(shù)字技術的進一步發(fā)展,數(shù)字技術可以將社會運行進行數(shù)據(jù)化重構,形成海量數(shù)據(jù)。海量數(shù)據(jù)被各種軟件、數(shù)字平臺捕獲后,傳輸給由計算機機器語言構成的虛擬人類大腦進行機器學習。所以,海量數(shù)據(jù)越大越豐富,機器學習的效果越好,算法越精準,產(chǎn)出結果的適用性與指導性就越強。在機器語言階段,計算機分析的對象均是經(jīng)過數(shù)字技術處理過后的數(shù)字信息,此時的語言數(shù)據(jù)是被數(shù)字化了的語言,即數(shù)字語言。數(shù)字語言是語言數(shù)據(jù)的高級形態(tài),具有普適性與統(tǒng)一性,可以用來描述所有的人類活動。
這里需要說明的是,語言數(shù)據(jù)的三個層級,是按照計算機對語言處理的方便程度以及“語言效率”的高低程度對語言的劃分,并不是語言進化的三個階段。在數(shù)字信息時代的今天,三種語言數(shù)據(jù)是并存的,都是數(shù)字經(jīng)濟的重要生產(chǎn)要素。
三、語言的泛生產(chǎn)要素性
語言的獨特生產(chǎn)要素性不僅來源于語言的本質(zhì)屬性,語言是人類最重要的交際和思維工具,也是人類文化和信息的最重要負載者,同時還是人類文化最重要的建構者和闡釋者。同時,語言與其他幾種生產(chǎn)要素有著非常的特殊關系,在其中發(fā)揮著重要作用,語言具有泛生產(chǎn)要素性(如圖1)。
首先,語言經(jīng)濟學的邏輯起點是視語言為人力資本。語言是人的重要勞動力,對于服務行業(yè)或是智力型崗位,情況尤為如此,一個人的語言能力遠比其體力更為重要。從世界或我國發(fā)展經(jīng)驗來看,語言能力薄弱或脆弱的地區(qū)通常是貧困地區(qū),有語言障礙的人群通常會是貧困的群體。
其次,語言不僅是一種“符號系統(tǒng)”,是人們彼此交流的一種重要工具,語言還是信息的載體,承載著“知識”。現(xiàn)代漢語詞典中對“知識的”定義是“人們在改造世界的實踐中所獲得的認識和經(jīng)驗的總和?!边@種“認識與經(jīng)驗”可能以書面語言的形式儲存于書籍雜志或媒體之中,也可能以概念或經(jīng)驗的形式儲存于人類大腦,而大腦中概念與經(jīng)驗的釋解仍然需要腦神經(jīng)語言或認知語言的參與。因此,語言與知識生產(chǎn)要素關系密切。
再次,就狹義技術而言,語言技能本身就是一項技術本領,擁有較高語言能力的人其語言技術(技能)就高。從廣義技術而言,以語言作為現(xiàn)代技術加工處理對象的現(xiàn)代語言技術,如多語網(wǎng)絡翻譯技術、語音識別技術、文字輸入技術等,在整個現(xiàn)代技術體系中占據(jù)著重要位置。此外,各個產(chǎn)業(yè)領域中技術發(fā)明專利的申請、技術的傳授學習都需要借助于語言來呈現(xiàn)或達成。語言是技術生產(chǎn)要素的伴隨者。
再次,作為生產(chǎn)要素的管理指的是某種管理章程或制度,或是某種管理行為。對于前者,張衛(wèi)國(2008)指出:“語言既是一種特殊的社會制度,具有規(guī)范人們言說表達的功能,同時語言也是人類其他制度的信息承載物,人類的一切政治、經(jīng)濟、社會等制度都需要通過語言文字來記載或通過語言言說所表達?!睂τ诤笳撸诟鞣N管理制度的基礎上,有效的管理行為還需要嚴謹?shù)乃季S與準確的言語表達,語言是人類表達思維的重要方式,高超的語言表達能力也是管理能力的重要體現(xiàn)。在人力資源管理中,語言能力以及以語言能力為基礎的溝通能力是企業(yè)在招聘、測試、培養(yǎng)、考績等全過程中對員工考察評估的重要核心指標,是高績效人力資源管理系統(tǒng)的基礎,對員工產(chǎn)出與收益產(chǎn)生直接影響。
最后,語言本身是一種資本,可以為個人或群體帶來經(jīng)濟價值。然而,撇開語言的資本屬性,從其一般社會屬性而言,語言與資本、土地的關系也十分密切。語言能夠影響資本的流動與走向,為土地生產(chǎn)資料賦值。曾毅平(1998)研究指出:“社會語言文字使用的總體面貌對實現(xiàn)投資效益有著相當?shù)挠绊?,語言環(huán)境是資金得以有效運營的一個不容忽視的外部條件,語言環(huán)境也是一種投資環(huán)境。”在外商對華投資中,“語言距離不僅會直接削弱外商對華直接投資,而且還會通過雙邊貿(mào)易額間接影響外商對華直接投資?!?/p>
四、語言產(chǎn)業(yè)發(fā)展新模式——語言數(shù)據(jù)產(chǎn)業(yè)
(一)語言數(shù)據(jù)產(chǎn)業(yè)的內(nèi)涵與外延
依照語言數(shù)據(jù)的屬性與功能,我們嘗試將語言數(shù)據(jù)產(chǎn)業(yè)定義為,視語言數(shù)據(jù)為數(shù)字經(jīng)濟生產(chǎn)要素的重要組成部分,對各類語言數(shù)據(jù)進行收集儲存、管理經(jīng)營、加工應用,以生產(chǎn)各類語言數(shù)據(jù)產(chǎn)品或提供語言數(shù)據(jù)服務的產(chǎn)業(yè)。該定義的前提是語言數(shù)據(jù)是數(shù)字經(jīng)濟生產(chǎn)要素的重要組成部分,發(fā)展語言數(shù)據(jù)產(chǎn)業(yè)的目的就是通過語言數(shù)據(jù)產(chǎn)品的生產(chǎn),或?qū)婋s的語言數(shù)據(jù)進行管理、加工與應用,從而更好地為數(shù)字經(jīng)濟的健康發(fā)展提供高質(zhì)量的數(shù)據(jù)生產(chǎn)要素,并為其它生產(chǎn)要素提供應有的語言服務。語言數(shù)據(jù)產(chǎn)業(yè)是一個長鏈條、寬口徑的新型產(chǎn)業(yè)模式,涉及多種業(yè)態(tài)類型。語言數(shù)據(jù)的挖掘與收集、語言數(shù)據(jù)庫的建設與維護、語言數(shù)據(jù)的存儲與傳輸、語言數(shù)據(jù)的計算機分析、語言數(shù)據(jù)產(chǎn)品的營銷、語言數(shù)據(jù)管理服務標準的制定、語言數(shù)據(jù)人才的培養(yǎng)等都將是伴隨語言數(shù)據(jù)產(chǎn)業(yè)發(fā)展的相關業(yè)態(tài)。
(二)語言數(shù)據(jù)產(chǎn)業(yè)發(fā)展中的問題
作為語言產(chǎn)業(yè)發(fā)展的新模式,語言數(shù)據(jù)產(chǎn)業(yè)還處于產(chǎn)業(yè)發(fā)展的初期階段,加之語言數(shù)據(jù)本身的特征與屬性,該產(chǎn)業(yè)目前發(fā)展顯露出一些問題。
1.語言數(shù)據(jù)的產(chǎn)權確立問題。語言數(shù)據(jù)的來源口徑較多,既有從現(xiàn)實空間搜集到的語言資料所構建的語料庫數(shù)據(jù),如醫(yī)患多模態(tài)對話數(shù)據(jù)庫、公共空間的語言景觀數(shù)據(jù)庫、教師課堂話語語料庫等,也有從互聯(lián)網(wǎng)獲得的各種網(wǎng)絡語言數(shù)據(jù)產(chǎn)品或服務,如網(wǎng)絡字體、表情包、網(wǎng)絡配音等,還有日常生活中個人在進行電子登錄或各種操作中,被各種應用軟件后臺獲取的個人語言數(shù)據(jù),如賬號信息、地址信息、人臉識別的電子信息等。語言數(shù)據(jù)的廣來源性造成數(shù)據(jù)產(chǎn)權的難確定性。在產(chǎn)權難以確定的情況下,產(chǎn)權的保護就成了空談。然而,在數(shù)字經(jīng)濟時代,數(shù)據(jù)成為極其重要的生產(chǎn)要素,對數(shù)據(jù),尤其是語言數(shù)據(jù)的知識產(chǎn)權保護尤為重要,是保障數(shù)字經(jīng)濟健康發(fā)展的重要舵手。
2.語言數(shù)據(jù)的安全問題。語言數(shù)據(jù)的安全性主要是指語言本身的質(zhì)量安全性和使用過程中有可能對他人造成的安全性傷害。語言數(shù)據(jù)收集渠道多、來源廣,通過各個渠道獲取而來的語言數(shù)據(jù)質(zhì)量參差不齊。那些質(zhì)量較差,甚至惡劣的語言數(shù)據(jù)會嚴重影響語言數(shù)據(jù)庫的使用安全。比如,通過網(wǎng)絡獲取的語言數(shù)據(jù)可能會是不同時代、不同國度、不同文化的語言數(shù)據(jù),還有可能是人工智能產(chǎn)生的語言數(shù)據(jù)。這些語言數(shù)據(jù)混雜了不同的意識形態(tài)偏見、文化習俗偏見,帶有較多不文明用語,甚至違反了倫理道德,如果對該類語言數(shù)據(jù)不加“潔洗”就加以應用,必定會對生產(chǎn)的語言數(shù)據(jù)產(chǎn)品或提供的語言數(shù)據(jù)服務產(chǎn)生極大的負面影響。其次,語言數(shù)據(jù)在存儲、傳輸、應用過程中如不加強防護措施,極易造成數(shù)據(jù)的泄露問題。泄露的語言數(shù)據(jù)關乎個體或社團的隱私,甚至國家的語言安全,若不引以重視,將對個人或國家造成難以挽回的重大損失。
3.語言數(shù)據(jù)的對接共享問題。語言數(shù)據(jù)有可能來源于不同的語料庫,而現(xiàn)行研究范式并沒有對語料庫的標注體系進行規(guī)范化統(tǒng)一,并未規(guī)定同類型的語料庫使用同系統(tǒng)的標注規(guī)范,這就造成了即便是取自同類別的兩個不同語料庫的語言數(shù)據(jù)也難以直接進行同類對比分析,更難以將兩個語料庫研究結果直接對接。此外,當前語言數(shù)據(jù)的“孤立”現(xiàn)象比較嚴重。同類研究機構之間、政府各部門之間、甚至課題組之間都有可能建有自己的(語言)數(shù)據(jù)庫,但是出于各種原因,相關或同類(語言)數(shù)據(jù)庫資源未能實現(xiàn)共享,同類數(shù)據(jù)的反復采集不僅對個體帶來不便,增加了泄露風險,而且未能對(語言)數(shù)據(jù)實現(xiàn)綜合利用。
4.語言數(shù)據(jù)產(chǎn)業(yè)發(fā)展的思維模式問題。如前所述,語言數(shù)據(jù)產(chǎn)業(yè)涉及語言數(shù)據(jù)的收集挖掘、語言數(shù)據(jù)的存儲、語言數(shù)據(jù)的管理、語言數(shù)據(jù)的加工、語言數(shù)據(jù)的應用以及語言數(shù)據(jù)的產(chǎn)品開發(fā)等多個環(huán)節(jié)、多道工序。每一個環(huán)節(jié)工序上出現(xiàn)問題都將影響后續(xù)環(huán)節(jié)的正常進行,嚴重者影響整個語言數(shù)據(jù)產(chǎn)品的生產(chǎn)或語言數(shù)據(jù)服務提供的質(zhì)量。因此,可以說,語言數(shù)據(jù)產(chǎn)業(yè)是一個由多個語言數(shù)據(jù)產(chǎn)業(yè)業(yè)態(tài)構成的鏈式產(chǎn)業(yè),其發(fā)展呈現(xiàn)鏈狀模式,這與傳統(tǒng)語言產(chǎn)業(yè)的簇狀發(fā)展模式不同。倘若各語言數(shù)據(jù)業(yè)態(tài)只是自顧獨自發(fā)展,沒有全局觀念、鏈式思維,那么不可能提升整個語言數(shù)據(jù)產(chǎn)業(yè)的發(fā)展質(zhì)量,更不可能發(fā)揮出語言數(shù)據(jù)對數(shù)字經(jīng)濟應有的支撐作用。
(三)相關規(guī)劃與建議
1.加強對語言數(shù)據(jù)產(chǎn)業(yè)的研究。在我國,語言產(chǎn)業(yè)的發(fā)展也不過十年左右的時間。學界、業(yè)界對它的認識仍在不斷地深化與拓寬,對其內(nèi)涵的界定、產(chǎn)業(yè)邊界的確定、業(yè)態(tài)分類標準的敲定、統(tǒng)計指標的確定等方研究至今未形成統(tǒng)一共識。而作為語言產(chǎn)業(yè)發(fā)展的新模式,語言數(shù)據(jù)產(chǎn)業(yè)更是一個嶄新的研究領域。需要盡快加強對其進行學理與實踐研究,形成一批具有理論指導性和實踐操作性的研究成果,為制定語言數(shù)據(jù)產(chǎn)業(yè)高質(zhì)量發(fā)展對策提供依據(jù)。
2.加大政府扶持與引導。政府應從國家戰(zhàn)略高度為語言數(shù)據(jù)產(chǎn)業(yè)創(chuàng)設更加開放創(chuàng)新的產(chǎn)業(yè)環(huán)境,加大對相關研究的支持力度,制定語言數(shù)據(jù)產(chǎn)業(yè)與市場的法規(guī)政策,建立語言數(shù)據(jù)產(chǎn)業(yè)人才培養(yǎng)機制,重視語言數(shù)據(jù)產(chǎn)業(yè)各鏈條業(yè)態(tài)人員的培養(yǎng)與管理,建立語言數(shù)據(jù)職業(yè)規(guī)范與倫理道德等條例引導語言數(shù)據(jù)產(chǎn)業(yè)健康發(fā)展。同時,加強政府各相關部門之間的合作,建立相應的協(xié)調(diào)溝通機制,倡導語言數(shù)據(jù)的互通共享。
3.強化對語言數(shù)據(jù)產(chǎn)業(yè)的知識產(chǎn)權保護。我國的知識產(chǎn)權意識較過去有了顯著提高,但是對于高度網(wǎng)絡化的語言數(shù)據(jù)產(chǎn)業(yè)來說尚缺乏清晰的產(chǎn)權意識,如網(wǎng)絡字體、網(wǎng)絡主頁的獨創(chuàng)性、網(wǎng)絡表情包的使用、網(wǎng)絡段子的著作權等類型的語言數(shù)據(jù)都發(fā)生過產(chǎn)權爭議或糾紛。因此,應從政府指導、行業(yè)監(jiān)管、法律建構等層面對語言數(shù)據(jù)產(chǎn)品和語言數(shù)據(jù)服務進行產(chǎn)權保護,對于難以確權的現(xiàn)實公共空間和網(wǎng)絡空間的語言數(shù)據(jù)進行合理化產(chǎn)權明晰,避免引發(fā)產(chǎn)權爭議。對于涉及個人隱私的語言數(shù)據(jù)要加強保護,加大對泄露、侵犯個人隱私語言數(shù)據(jù)的違法犯罪行為的懲處力度。
4.培養(yǎng)語言數(shù)據(jù)產(chǎn)業(yè)發(fā)展的鏈式思維。產(chǎn)業(yè)鏈不僅是實際存在的一種產(chǎn)業(yè)集,更是一種思維方式。產(chǎn)業(yè)要想做大做強,就不能停留在“單兵作戰(zhàn)”的階段,必須具有產(chǎn)業(yè)鏈的產(chǎn)業(yè)全局觀。鏈式發(fā)展思維對于語言數(shù)據(jù)產(chǎn)業(yè)而言尤為重要。語言數(shù)據(jù)產(chǎn)業(yè)鏈上的各業(yè)態(tài)產(chǎn)業(yè)聯(lián)系緊密,相互影響,每一個鏈條業(yè)態(tài)的發(fā)展出現(xiàn)問題都直接影響后續(xù)各業(yè)態(tài)的發(fā)展及整個產(chǎn)業(yè)的發(fā)展。鏈式發(fā)展思維要求語言數(shù)據(jù)產(chǎn)業(yè)監(jiān)管部門要抓好產(chǎn)業(yè)發(fā)展的全局指導與安排,產(chǎn)業(yè)鏈上的各業(yè)態(tài)行業(yè)從業(yè)者要融入語言數(shù)據(jù)產(chǎn)業(yè)發(fā)展的大框架,做好鏈條上的鏈接環(huán),守好一段渠,種好責任田。
5.借鑒國際先進經(jīng)驗。數(shù)字經(jīng)濟較發(fā)達的國家相比,我國的數(shù)字經(jīng)濟發(fā)展無論在數(shù)字基礎設施建設、數(shù)據(jù)安全保護還是數(shù)字貿(mào)易的規(guī)則制定等方面都還存在較大差距。語言數(shù)據(jù)產(chǎn)業(yè)是數(shù)字經(jīng)濟時代的一個重要產(chǎn)業(yè)模式。我們要在數(shù)據(jù)保護分級分類精細化管理、數(shù)據(jù)市場一體化建設、個人隱私數(shù)據(jù)保護的立法、相關人才培養(yǎng)管理模式等方面借鑒國際先進經(jīng)驗,揚長避短,促進我國語言數(shù)據(jù)產(chǎn)業(yè)快速發(fā)展。
參考文獻:
[1]李宇明.數(shù)據(jù)時代與語言產(chǎn)業(yè)[J].山東師范大學學報:社會科學版,2020,65(05):87-98.
[2]張衛(wèi)國.作為人力資本、公共產(chǎn)品和制度的語言:語言經(jīng)濟學的一個基本分析框架[J].經(jīng)濟研究,2008(2):144-154.
[3]Pendakur, K., & Pendakur, R. (2002). Language as both human capital and ethnicity. International Migration Review, 36(1), 147-177.
[4]Huu, N., Larimo, J., & Ali, T. (2016). How do ownership control position and national culture influence conflict resolution strategies in international joint ventures. International Business Review, 25(2), 559-568.
[5]陳鵬.語言產(chǎn)業(yè)的基本概念及要素分析[J].語言文字應用,2012(03):16-24.
[6]李宇明.語言也是“硬實力”[J].華中師范大學學報:人文社會科學版,2011,50(05):68-72.
[7]黃少安,蘇劍,張衛(wèi)國.語言產(chǎn)業(yè)的涵義與我國語言產(chǎn)業(yè)發(fā)展戰(zhàn)略[J].經(jīng)濟縱橫,2012(05):24-28.
[8]賀宏志.發(fā)展語言產(chǎn)業(yè),創(chuàng)造語言紅利——語言產(chǎn)業(yè)研究與實踐綜述[J].語言文字應用,2012(03):9-15.
[9]何宏志,陳鵬.語言產(chǎn)業(yè)導論[M].北京:語文出版社,2013:162-167.
[10]姜國權.發(fā)展數(shù)字時代的語言產(chǎn)業(yè)[N]. 中國社會科學報,2021-09-14(003).
[11]張新春,花旭.數(shù)字經(jīng)濟:增長邏輯與技術機理[J].改革與戰(zhàn)略,2021,37(04):75-84.
[12]彭婷.人工智能中語言問題的哲學審視——以馬克思恩格斯語言觀為視角[J].世界哲學,2020(02):17-26.
[13]李宇明.中國語言資源的理念與實踐[J].語言戰(zhàn)略研究,2019,4(03):16-28.
[14]李琳.區(qū)域經(jīng)濟發(fā)展與語言能力建設[J].吉首大學學報:社會科學版,2020,41(03):104-111.
[15]曾毅平.語言環(huán)境也是一種投資環(huán)境[J].暨南學報:哲學社會科學,1998(01):109-116.
[16]方芮.文化距離、語言距離與外商對華直接投資[D].山東大學,2020.
[17]劉昌華.數(shù)字經(jīng)濟:網(wǎng)絡空間的語言產(chǎn)業(yè)[J].黃河科技學院學報,2021,23(06):72-80.
[18]于曉,葉申南.歐日韓數(shù)字經(jīng)濟政策、發(fā)展趨勢及中國策略[J].財政科學,2021(06):135-141.
Abstract: As a type of resource, language bears an important attribute of economy, which promotes the development of language industry. In the era of digital economy, language functions as the main form and an important part of the production factor of data, bearing the nature of panproduction factors. With the tendency of language data, there comes a new development model of language industry—language data industry. Due to its early stage of development, the language data industry meets with some growth barriers.
For the sake of the healthy and stable development of the language data industry, some effective measures need taking to tackle the thorny problems, including strengthening the academic research, increasing the managerial support, stressing the legislation of property rights, advocating the chainmodel thinking of development, drawing on the advanced foreign experience, and so on.
Keywords:digital economy; production factor; language industry; language data industry
(責任編輯:范松楠)