• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      試論語言數據的經濟屬性

      2022-07-15 01:29:25王海蘭
      語言戰(zhàn)略研究 2022年4期
      關鍵詞:數字經濟

      提 要 數字經濟時代,數據成為關鍵生產要素,語言數據則是最為重要的數據類型。在語言作為人力資本、制度、產業(yè)之外,語言作為數據成為語言要素參與社會生產的一種新形式,展現出顯著的經濟屬性,主要表現在3個方面:第一,語言數據是數字技術發(fā)展的重要“物質基礎”,可促進數字技術創(chuàng)新發(fā)展和數字技術資本積累;第二,語言數據是生成用于決策的信息和知識最重要的“原始材料”,可優(yōu)化資源配置,提高全要素生產率;第三,語言數據是新語言職業(yè)和語言產業(yè)形成和發(fā)展的“助推器”,可促進社會分工,優(yōu)化產業(yè)結構。挖掘語言數據經濟紅利,需要樹立語言數據經濟意識,推動語言數據價值化,培育和發(fā)展語言數據相關職業(yè)和產業(yè)。

      關鍵詞 數字經濟;語言數據;語言經濟;語言職業(yè);語言產業(yè)

      中圖分類號 H002 文獻標識碼 A 文章編號 2096-1014(2022)04-0026-09

      DOI 10.19689/j.cnki.cn10-1361/h.20220402

      Language is closely related with economy and scholars have approached the relationship between language and economy from different perspectives. Language has become a new form of human capital, system, and industry. This study focuses on the economic attributes of language. In the era of digital economy, data have become a key factor of production, and language data is the most important type of data. Language elements participate in social production and show significant economic attributes which are mainly reflected in three aspects. First, language data act as an important “material basis” for the development of digital technology, promoting the innovation and development of digital technology and the accumulation of digital technology capital. Second, language data serve as the most important “raw materials” for generating information and knowledge for decision-making, optimizing resource allocation and improving total factor productivity. Third, language data are the “booster” for the formation and development of new language occupations and language industries, promoting social division of labor and optimizing industrial structure. To tap the economic dividends of language data, we need to raise the awareness of language data economy, promote the value of language data, and cultivate and develop language data-related occupations and industries.

      digital economy; language data; language economy; language occupations; language industry

      一、引 言

      語言的本質是信息的載體和交流的媒介,信息交換伴隨著人類社會發(fā)展的始終,更是人類經濟生活的根本(宋景堯2019)。語言與經濟有著千絲萬縷的聯系,可以說,人類的一切經濟活動都離不開語言。1965年,信息經濟學家雅各布·馬爾沙克(Jacob Marschak)在考察信息傳遞效率問題時,指出語言具有與其他資源一樣的經濟特征,如價值、效用、費用和收益等,首次提出“語言經濟學”概念(Marschak 1965)。關于語言影響經濟增長的機制,或者說對語言經濟屬性的觀察路徑,目前主要有3個維度:第一,語言能力作為一種重要的人力資本,影響勞動者的收入和就業(yè)(Grenier 1984;Chiswick 1991;劉國輝,張衛(wèi)國2016;王海蘭2018);第二,語言作為一種制度,與信任、文化、信息傳遞和家庭偏好等密切相關,是影響交易成本的重要因素(Ku &Zussman 2010;張衛(wèi)國2008;黃少安2015;王海蘭2017),語言政策和規(guī)劃作為國家的重要制度安排也是語言經濟學研究的一個重要維度(Grin 2003;薄守生2008;趙世舉,葛新宇2017);第三,語言作為經濟生產的對象,可發(fā)展為語言產業(yè),影響經濟發(fā)展(蘇劍2014;陳鵬2017;李艷2017;李宇明2019)。

      語言因素參與社會生產的形式、方式和程度與經濟發(fā)展中所需的生產要素、生產方式等密切相關,在農業(yè)經濟、工業(yè)經濟和信息經濟不同的經濟形態(tài)中,語言經濟屬性的顯示度和大小存在很大差異。在人口流動和信息化兩大驅力的推動下,語言對經濟的貢獻越來越顯著,以至于成為不容漠視的經濟現象(李宇明2012)。當前,人類已進入數字經濟時代,數字技術帶來生產方式的巨大變革,數據要素成為關鍵生產要素。無論是從量上還是質上看,語言數據都是最為重要的數據,因而也是重要的生產要素(李宇明2020)。在數字經濟時代,在語言作為人力資本、制度、產業(yè)之外,語言作為數據成為語言要素參與社會生產的一種新形式。語言數據具有哪些經濟屬性,在數字經濟發(fā)展中發(fā)揮什么作用,怎么發(fā)揮作用,如何挖掘語言數據的經濟紅利,這是數字經濟時代語言經濟學需要回答的問題。

      二、語言數據經濟屬性的主要表現

      人類已進入數字經濟時代。中國信息通信研究院提供的數據顯示,2020年,其測算的47個國家數字經濟增加值規(guī)模達到32.6萬億美元,同比名義增長3.0%,占所測算國家GDP總量的43.7%;其中發(fā)達國家數字經濟規(guī)模達到24.4萬億美元,占其GDP總量的54.3%。2020年,我國數字經濟規(guī)模達到39.2萬億元,較2019年增加3.3萬億元,占GDP總量的38.6%。國家統(tǒng)計局發(fā)布的《數字經濟及其核心產業(yè)統(tǒng)計分類(2021)》將數字經濟定義為“以數據資源作為關鍵生產要素、以現代信息網絡作為重要載體、以信息通信技術的有效使用作為效率提升和經濟結構優(yōu)化的重要推動力的一系列經濟活動”。數字經濟的定義包括4層含義:第一,數字經濟是繼農業(yè)經濟、工業(yè)經濟之后的一種新的經濟形態(tài),是信息經濟發(fā)展的高級階段;第二,以數字技術為核心的信息通信技術是數字經濟的主要驅動力;第三,數據資源是數字經濟的關鍵生產要素;第四,數字經濟發(fā)展的重要推力是數字技術和數據要素驅動下生產效率的提升和經濟結構的優(yōu)化。

      語言數據是以語言符號體系為基礎構成的各種數據,內部包括語言學科數據、話語數據、語言衍生數據、人工語言數據和語言代碼數據等5種類型(李宇明,王春輝2022),是最為重要的數據形式。結合數字經濟的定義和語言數據與數據的關系,語言數據的經濟屬性主要表現在3個方面:第一,語言數據是數字技術發(fā)展的重要“物質基礎”,可推動數字技術的創(chuàng)新發(fā)展和數字技術資本的積累;第二,語言數據是構成賴以判斷和決策的信息和知識的重要“原始材料”,可提高資源配置效率,提升全要素生產率;第三,語言數據是新職業(yè)、新業(yè)態(tài)形成和發(fā)展的重要“助推器”,可深化社會分工,促進產業(yè)結構調整和優(yōu)化。

      (一)語言數據促進數字技術的創(chuàng)新發(fā)展

      科學技術是第一生產力。在任何經濟形態(tài)中,技術都是影響經濟增長的重要變量。但在不同經濟形態(tài)中,推動經濟增長的具體關鍵技術不同。農業(yè)經濟時代,農業(yè)生產技術是關鍵技術;工業(yè)經濟時代,工業(yè)技術是關鍵技術,如機械制造技術;數字經濟時代,以云計算、大數據、物聯網、移動互聯網、人工智能、區(qū)塊鏈等為主的數字技術成為推動經濟增長的關鍵技術。數字技術重塑了經濟社會的生產模式、產業(yè)形態(tài)、商業(yè)模式,提升了資源配置效率(易憲容,等2019),其賦能并重構傳統(tǒng)生產要素,提升農業(yè)、工業(yè)及服務業(yè)的產能效應,推動產業(yè)結構優(yōu)化升級,形成高質量發(fā)展態(tài)勢(王凱2021)??傊瑪底旨夹g是數字經濟的核心驅動力,也是數字革命核心技術(劉平峰,張旺2021),對經濟高質量發(fā)展具有顯著促進作用,是當下經濟高質量發(fā)展的重要引擎(任轉轉,鄧峰2022)。

      數據與數字技術相互依存,相互促進。云計算、大數據、物聯網、移動互聯網、人工智能等信息通信技術(ICT)新技術、新模式的發(fā)展和應用無一不是以海量數據為基礎,又反過來帶動了數據量的爆發(fā)式增長。語言數據的采集、集聚、處理和應用無疑有賴于數字技術的發(fā)展,但反過來語言數據對數字技術的發(fā)展也不可或缺。語言是最重要的信息載體,是信息通信技術處理的主要對象。從計算器到計算機的突破,關鍵就在于二者處理的對象不同,計算器能處理的僅是數字,計算機還可處理語言文字,人類對提升語言文字處理能力和水平的孜孜追求是推動信息通信技術發(fā)展的重要力量。以移動通信技術和人工智能為例。人類移動通信技術發(fā)展歷程顯示,對語言文字處理和傳輸效率的追求是通信技術發(fā)展的重要驅動力,信息通信技術發(fā)展史可看作一部語言文字處理和傳輸能力不斷提升、加速的歷史。1G通信系統(tǒng)是基于模擬傳輸的,直接使用模擬語音調制技術;2G通信系統(tǒng)包含了全速率完全兼容的增強型話音編解碼技術,使得話音質量得到質的改進,自適應語音編碼(AMR)技術的應用,極大提高了系統(tǒng)通話質量;3G通信系統(tǒng)支持話音和多媒體數據通信,可提供高速數據、慢速圖像和電視圖像等各種寬帶信息業(yè)務;4G通信系統(tǒng)具有超過2Mbit/s的非對稱數據傳輸能力(張勉2007),可傳輸高質量音頻、視頻、圖像和各種應用程序(APP);5G通信系統(tǒng)支持海量數據傳輸,高數據傳輸速率,超低時延,實現萬物互聯。如圖1所示。語言數據是移動通信技術傳輸的主要內容,語言數據的形態(tài)、規(guī)模、結構、組合形式等對移動通信技術的發(fā)展有著重要影響。

      人工智能是諸多信息通信技術或新一代信息技術的集成(蔡躍洲,陳楠2019),廣泛應用于社會經濟領域,對經濟高質量發(fā)展和數字技術的創(chuàng)新發(fā)展發(fā)揮著重要作用。人工智能與語言密切相關,馮志偉(2018)指出,“在人工智能這個領域,得語言者得天下”。語言對人工智能的重要性,又突出表現在語言智能上。語言智能是人工智能的重要組成部分,是語言科學與人工智能深度融合的前沿交叉領域,被譽為人工智能“皇冠上的明珠”。語言數據是語言智能發(fā)展的物質基礎,語言數據質量的高低直接影響語言智能發(fā)展水平的高低(胡開寶,尚文博2022)。特別是在語言智能進入機器學習時代后,語言智能發(fā)展對語言數據的依賴程度越來越高。各種語言數據,特別是海量的話語數據,是人工智能發(fā)展的重要基礎。如何建設高質量的語言數據庫,為語言智能和人工智能發(fā)展提供“底層支撐”,是語言學和計算機學科共同努力的方向。其他數字技術的發(fā)展,如大數據、云計算、區(qū)塊鏈等同樣需要以海量的、多類型的、高質量的語言數據為基礎。

      (二)語言數據提升資源配置效率

      數字經濟與傳統(tǒng)經濟的區(qū)別在于,數字經濟是以用戶的需求端為導向,并以數字化、智能化的方式獲得的信息為客戶發(fā)現潛在的、不可見的需求,以及為客戶創(chuàng)造新的需求,從而為客戶提供定制化的產品與服務,并讓客戶在使用產品及獲得服務的過程中不斷創(chuàng)造新價值(易憲容,等2019)。簡言之,數字經濟的本質是將經過數字化處理后的數據轉化為可投入生產的有用信息,這大大降低了供求兩端不同經濟主體之間的信息不對稱,進而提高資源配置的效率,促進經濟結構的優(yōu)化。數據不是唯一的生產要素,但作為數字經濟全新的、關鍵的生產要素,貫穿于數字經濟發(fā)展的全部流程,與其他生產要素不斷組合迭代,加速交叉融合,引發(fā)生產要素多領域、多維度、系統(tǒng)性、革命性群體突破,其大量性、高速性、多樣性、低價值密度性、真實性等特征,能夠有效解決信息孤島、數據鴻溝、信息不對稱等問題(陳書晴,等2022)。語言數據是占比最大的數據類型,是數字化、智能化處理的核心內容,是構成賴以決策的信息的最重要的“原始材料”,在數據轉化為有價值的信息和知識的全過程中都發(fā)揮著重要作用,可助力政府服務和數字治理的智能化,企業(yè)決策的智能化,提升整個社會的資源配置效率。例如,各類社交媒體平臺的文本數據包含了經濟主體(如投資者、消費者)豐富的情緒、情感等心理信息(洪永淼,汪壽陽2021),這些信息可反映企業(yè)、家庭、個體的選擇偏好、投資傾向和需求狀況,以及可能的行為選擇,助力企業(yè)優(yōu)化生產決策和營銷策略。

      以人力資源的優(yōu)化配置為例。傳統(tǒng)的人員招聘與配置過程中主要依靠經驗判斷與簡單的統(tǒng)計分析,存在很強的主觀性和模糊性,管理動作也往往具有滯后性(陳國青,等2020)?;诖髷祿闹悄芑瞬殴芾恚脭底旨夹g對求職人員的簡歷、以往學習或工作相關的文字數據、面試過程中的話語數據等組成的全方位的語言數據進行語義分析和數據挖掘,實現簡歷篩選、面試評估、人崗匹配和人才管理的全智能化,將最合適的人配置在最合適的崗位上。反過來,人才培養(yǎng)部門可通過對勞動力市場的招聘需求等語言數據的分析,提取人才需求信息,以培養(yǎng)與市場需求相匹配的人才。例如,中國信息通信院2018年選取數字經濟就業(yè)關鍵檢索詞,對國內數十家主流招聘平臺進行關鍵詞檢索,收集了168萬余條數字經濟招聘信息,建立起數字經濟就業(yè)數據庫,通過對就業(yè)數據庫的數字化、智能化處理,展現了經濟社會對數字經濟就業(yè)方向、人才能力等的真實需求,對我國數字經濟人才的培養(yǎng)和流動具有重要指導意義。基于勞動力市場供需兩側語言數據的信息挖掘,可降低人才供給與市場需求之間的信息不對稱,優(yōu)化人才培養(yǎng),提高人力資源配置效率。

      (三)語言數據催生新職業(yè)和新業(yè)態(tài)

      數字經濟的發(fā)展催生了大量新職業(yè)、新崗位,語言職業(yè)類型多元化,需求增長迅速。2015年,我國頒布了《中華人民共和國職業(yè)分類大典》(以下簡稱《大典》),將職業(yè)分為8個大類、75個中類、434個小類、1481個職業(yè)。與1999年的《大典》相比,新版《大典》在涉及第一產業(yè)的“農、林、牧、漁業(yè)生產及輔助人員”大類中減少了6個小類、83個職業(yè),在涉及第二產業(yè)的“生產制造及有關人員”大類中減少了24個小類、526個職業(yè);同時在涉及第三產業(yè)的“專業(yè)技術人員”和“社會生產服務和生活服務人員”大類中,職業(yè)數量分別增加了11個和81個。2015年《大典》頒發(fā)以來,2019、2020和2021年人社部、市場監(jiān)管總局、統(tǒng)計局又聯合發(fā)布了56個新職業(yè),主要為第三產業(yè)的職業(yè)。總體上看,第三產業(yè)的職業(yè)數量和就業(yè)人口顯著增加。第三產業(yè)的職業(yè)為服務業(yè)職業(yè),基本上都是以語言能力作為主要勞動工具,或者以語言為主要勞動對象。有的職業(yè)屬于純語言職業(yè),如翻譯、速錄師、講解員、語言教師、播音員等;有的職業(yè)對語言能力有較強的要求,如導游、醫(yī)生、律師等。2015年《大典》及2019年之后新增的職業(yè)多為適應數據時代和數字經濟發(fā)展需要而設置的,如快遞員、人工智能工程技術人員、物聯網工程技術人員、大數據工程技術人員、數字化管理師、在線學習服務師等。這些職業(yè)中,不少屬于語言職業(yè)。如在線學習服務師、職業(yè)培訓師、互聯網營銷師中的“直播銷售員”是純語言職業(yè),而快遞員、數字化管理師等職業(yè)都對語言能力有較高要求。如《快遞員國家職業(yè)技能標準(2019年版)》規(guī)定快遞員的職業(yè)能力特征為“具有較強的聽寫、理解、表達、應變、溝通和學習能力,能準確計算,分辨顏色,識別方位,動作協調”,語言能力是其中的核心能力。

      《中國數字經濟就業(yè)發(fā)展研究報告:新形態(tài)、新模式、新趨勢》(以下簡稱《報告》)指出,在零工經濟、平臺經濟、共享經濟等新模式、新業(yè)態(tài)的引領下,網絡銷售、網絡運營、淘寶客服、短視頻審核、數據標注、外賣騎手等新型崗位不斷涌現,成為熱門崗位。這些崗位都以語言能力為核心能力?!秷蟾妗饭矙z索到10萬個電商客服相關崗位,吸納就業(yè)人數達73萬余人次;與數據標注相關的就業(yè)信息共1萬余條,涉及語料標注、法律文書標注、外語聽寫標注、語音撰寫標注等,其中93.4%的條目為兼職招聘,平均每個兼職崗位招聘471人次;2018年與網絡運營有關的招聘條目共18萬余條,工作內容主要為公眾號維護、文案撰寫、數據分析、規(guī)劃推廣等與語言文字密切相關的內容;網絡主播招聘信息近7500條,招聘人數近14.3萬人。這些崗位多與語言數據的處理有關。數字經濟的發(fā)展還將繼續(xù)催生更多新的語言職業(yè),涌向更多以語言能力為核心能力,以語言文字為主要工作內容或勞動對象的崗位。這些職業(yè)和崗位是數字經濟帶來的社會分工的結果,同時也是數字經濟發(fā)展的重要支撐力量,應該得到更好的重視和培育。

      數字經濟帶來生產方式的變革,數字技術的廣泛應用推動了新業(yè)態(tài)、新模式的發(fā)展,也推動了語言產業(yè)的新發(fā)展,催生了一批與語言數據相關的新產業(yè)。以下以語言數據業(yè)和語言智能業(yè)為例加以分析。

      語言數據業(yè)。語言數據業(yè)是指采用市場化經營方式生產語言數據產品或提供語言數據服務,滿足國家或個人對各種語言數據產品或服務的多層次需求的生產或服務活動。包括對語言數據進行收集庫存、管理經營、加工應用的行業(yè),涉及語言數據的收集、語言數據庫的建設、語言數據的云存儲、語言數據的計算機應用、語言數據產品的營銷、語言數據及其各種規(guī)范標準、語言數據產業(yè)人才的培養(yǎng)等業(yè)態(tài)(李宇明2020)。2021年12月,國務院印發(fā)《“十四五”數字經濟發(fā)展規(guī)劃》(國發(fā)[2021]29號),這是我國數字經濟領域的首部國家級專項規(guī)劃。規(guī)劃提出“支持市場主體依法合規(guī)開展數據采集,聚焦數據的標注、清洗、脫敏、脫密、聚合、分析等環(huán)節(jié),提升數據資源處理能力,培育壯大數據服務產業(yè)”,而數據服務產業(yè)中很大部分屬于語言數據產業(yè)。在數字技術推動下,社會各界對數據,特別是標準化數據的需求日益增長,語言數據產業(yè)具有廣闊的發(fā)展前景。如數據標注業(yè)。數據標注指通過貼標簽、做記號、標顏色、劃重點的方式,標注出數據的不同點、相似點或類別,為機器提供訓練和學習資料的過程。數據標注業(yè)是指以語言數據標注為核心業(yè)務的經營性活動的集合。隨著對標準化數據需求的增長,數據標注業(yè)已成為一個新興產業(yè)形態(tài)?!吨袊鴶底纸洕l(fā)展白皮書》(2020年)指出,數據標注有望成為撬動產業(yè)規(guī)模發(fā)展的新引擎,預計到2025年我國數據標注核心產業(yè)規(guī)模將達500億元,帶動相關產業(yè)規(guī)模達到1800億元。

      語言智能業(yè)。語言智能旨在運用計算機技術和信息技術,讓機器理解、處理和分析人類語言,實現人機語言交互(胡開寶,田緒軍2020),使機器在一定程度上擁有理解、應用和分析人類語言的能力(胡開寶,尚文博2022)。語言智能業(yè)包括機器翻譯、語音轉寫、語音輸入法、語言智能測評、智能教學、智能寫作、智能客服、交互式智能問答、情緒識別等多種業(yè)態(tài),在經濟社會中已經產生巨大影響。據統(tǒng)計,語音智能領域單位技術產出高于人工智能行業(yè)整體:目前我國人工智能創(chuàng)業(yè)項目中有252家處于語音識別和語義分析賽道,占總量的10.6%;截至2018年底,我國人工智能領域申請專利44.4萬件,其中,語音識別與自然語言處理技術申請專利6.1萬件,占比達13.6%。《2020~2021中國智能語音產業(yè)發(fā)展白皮書》顯示,2021年我國智能語音產業(yè)市場規(guī)模預計達到285億元,同比增長44%。隨著智能語音技術的成熟和市場對智能化需求的不斷擴大,智能語音產業(yè)將保持高速增長,預計2025年國內前裝車載語音市場規(guī)模約為32億元,2030年僅我國翻譯機市場規(guī)模就將達到56.2億元。語言智能產業(yè)具有廣泛的行業(yè)關聯性和豐富的上下游應用場景。其上游包括以信息資源處理為主導的信息收集、分析、處理服務,以翻譯資源為主導的翻譯服務,以及以技術資源為主導的技術服務、數字內容加工等;下游包括教育培訓、語言研究、文化出版、智能客服、動漫、智慧旅游、智慧物流、智慧交通、科技情報等多種行業(yè),與數字產業(yè)化和產業(yè)數字化發(fā)展息息相關。隨著以5G、人工智能、工業(yè)互聯網、物聯網、云計算、區(qū)塊鏈等現代信息技術為基礎的新型基礎設施建設的深入推進和智慧城市的發(fā)展,語言智能產業(yè)將會迎來更大的發(fā)展空間。

      三、挖掘語言數據的經濟紅利

      語言數據已展現出強經濟屬性,在促進經濟增長方面發(fā)揮實質性作用。但目前人們的語言數據經濟意識還較薄弱,語言數據成為生產要素的轉化率亟待提高,語言數據經濟紅利的挖掘空間巨大。

      (一)樹立語言數據的經濟屬性意識

      首先,要樹立語言數據意識,強化語言數據概念。目前,“語言數據”在中文語境里還是較新且較少使用的概念,本質上是對“語言數據”的重要性認識不足,研究還比較薄弱(李宇明,王春輝2022)。語言數據與語言資源密切相關,但又有區(qū)別。語言數據與現代信息技術密切相關。如果說語言資源是加工提煉后可供使用的石油,那么語言數據就是尚待開采和加工處理的原油。數字技術帶來了語言數據的爆炸式增長,擴大了“原油儲量”,同時又大大提升了將語言數據轉化為語言資源的可能性和效率,提高了“原油開采率”。樹立語言數據意識,強化語言數據概念,是適應數字化發(fā)展的需要,也是深化語言學與計算機科學融合發(fā)展的需要。其次,要樹立語言數據的經濟屬性意識。數據是數字經濟的關鍵生產要素,目前已逐漸成為一種社會共識,語言數據作為最重要的數據具備進入經濟生產領域的潛質。樹立語言數據的經濟屬性意識,就是要將語言數據置于社會經濟系統(tǒng)中進行觀察,研究其成為生產要素的條件、路徑和機制,以及如何對其他生產要素產生倍增效應,實現對語言數據的經濟開發(fā)利用,這是更好發(fā)揮數據生產要素功能的需要。

      (二)推動語言數據價值化

      數據資源具有潛在價值,只有將數據和數據的采集、存儲、處理、分析、應用等一系列勞動相結合,創(chuàng)造價值、實現價值并實現價值增值(倍增)才能發(fā)揮數據的作用(李海艦,趙麗2021)。語言數據經濟屬性的完全釋放同樣需要一個價值化的過程。本文參考李海艦,趙麗(2021)的方法,將語言數據形態(tài)演進的過程分為“語言數據——語言數據資源——語言數據資產(產品)——語言數據商品——語言數據資本”5個環(huán)節(jié)。最前面的“語言數據”環(huán)節(jié)是本文所加,因為我們認為語言數據不同于語言數據資源,海量的語言數據只有通過數字技術按照一定的標準采集、加工,形成可供機器或人使用的資源,才能具有了資源屬性,這是一個價值挖掘的過程。語言數據資產(產品)是指能夠帶來預期經濟收益的語言數據資源,不是所有的語言數據資源都可以變?yōu)檎Z言數據資產或產品,只有進行數字化、智能化轉化,成為企業(yè)決策信息的語言數據資源才能成為企業(yè)資產。例如,某電商平臺通過對消費者購買信息、客戶評價等文本數據的挖掘,獲取了消費者偏好和需求等方面的信息,進而對產品生產和營銷決策進行調整,實現精準投放,提高企業(yè)生產效率,這就是語言數據資源資產化的過程,創(chuàng)造了價值。語言數據商品是指可以在市場上交換的語言數據產品,交換環(huán)節(jié)使語言數據作為商品的價值得以實現。如前例,電商平臺將生產的語言數據資產(產品)在市場上出售,獲得收益。數據商品向數據資本轉變的關鍵是,在市場上用于交換的數據商品的交換價值是否被充分挖掘和無限放大,形成對數據勞動者勞動成果的無限次重復使用,并生成價值增值(倍增)的數據資本(李海艦,趙麗2021)。這個過程是社會生產對語言數據的充分利用。語言數據向語言數據資源、語言數據資產(產品)轉化的過程中,需要數字技術的廣泛參與,涉及語言數據的采集、清洗、標注、脫敏、脫密、聚合、語義挖掘等,語言數據資源和產品的質量直接關系到語言數據商品的銷售和資本化。在語言數據價值化的整個過程中,最重要的是語言數據產權的確認問題,只有明晰產權,語言數據才能實現交換和價值增值。語言數據價值化的過程如圖3所示。

      (三)發(fā)展語言數據相關職業(yè)和產業(yè)

      數字技術的發(fā)展依賴于語言數據,同時又創(chuàng)造了海量語言數據。對語言數據的采集、清洗、標注、分析、銷售等都需要專門的人才。隨著社會分工的精細化,數字經濟的發(fā)展將催生一批與語言數據相關的專門職業(yè),如數據標注等。需加強對語言數據職業(yè)和崗位的語言能力要求分析與人才培養(yǎng)。同時應加大對語言數據產業(yè)的培育,促進語言數據產業(yè)與相關產業(yè)的融合,增強語言數據產業(yè)的前向后向效應,如加強語言數據產業(yè)與語言智能產業(yè)的融合發(fā)展,優(yōu)化產業(yè)結構,等等。

      四、結 語

      在生產要素變革、生產方式改變的大背景下,數據成為數字經濟的關鍵生產要素,語言數據作為最重要的數據類型是語言參與社會生產的一種新形式,展現出顯著的經濟屬性,在促進數字技術創(chuàng)新發(fā)展和數字技術資本積累,優(yōu)化資源配置和產業(yè)結構,深化社會分工,提高全要素生產率中發(fā)揮重要作用。挖掘語言數據經濟紅利,需要樹立語言數據經濟意識,推動語言數據價值化,培育和發(fā)展語言數據相關職業(yè)和產業(yè)。

      《“十四五”數字經濟發(fā)展規(guī)劃》指出,“十四五”時期,我國數字經濟轉向深化應用、規(guī)范發(fā)展、普惠共享的階段,提出數據要素市場體系初步建立、產業(yè)數字化轉型邁上新臺階、數字產業(yè)化水平顯著提升、數字化公共服務更加普惠均等、數字經濟治理體系更加完善等目標。對語言數據和數字經濟關系的研究,體現了語言學者面向國家需求、回應社會重大問題的使命擔當和家國情懷,也是新時代語言經濟學的新使命。本文拋磚引玉,僅做了些粗淺探索,還需學界凝聚智慧,深入研究。語言學、經濟學和計算機學科等相關學科應加強聯系,合力研究和解決語言數據與數字經濟發(fā)展中的關鍵問題。第一,認識數字經濟的本質和發(fā)展規(guī)律,研究語言和語言數據作用于數字經濟的機制和路徑,特別是語言數據成為生產要素的條件、機制以及對其他生產要素的影響等;第二,調查數字經濟驅動下的語言產業(yè)發(fā)展現狀,制定語言產業(yè)發(fā)展規(guī)劃,培育新語言職業(yè)和語言產業(yè),推動語言數據相關產業(yè)與其他數字產業(yè)的融合發(fā)展;第三,研究數字經濟發(fā)展中的語言數據服務問題,包括語言數據的收集、清洗、標注、分析、流通等相關的系列服務,以及語言數據產業(yè)發(fā)展中的語言服務問題,如語言數據標注的標準制定等;第四,研究適應數字經濟發(fā)展的語言人才培養(yǎng)問題,以市場需求為導向培養(yǎng)跨學科、復合型、具有數字素養(yǎng)的語言人才,提升勞動力素質。

      參考文獻

      薄守生 2008 《語言規(guī)劃的經濟學分析》,《制度經濟學研究》第2期。

      蔡躍洲,陳 楠 2019 《新技術革命下人工智能與高質量增長、高質量就業(yè)》,《數量經濟技術經濟研究》第5期。

      陳國青,曾大軍,衛(wèi) 強,等 2020 《大數據環(huán)境下的決策范式轉變與使能創(chuàng)新》,《管理世界》第2期。

      陳 鵬 2017 《當代中國語言產業(yè)發(fā)展的三次浪潮》,《語言戰(zhàn)略研究》第5期。

      陳書晴,任昊翔,陶思佳,等 2022 《數據要素與多元市場主體融合機制研究》,《信息通信技術與政策》第1期。

      馮志偉 2018 《人工智能領域:得語言者得天下》,《語言戰(zhàn)略研究》第5期。

      洪永淼,汪壽陽 2021 《大數據如何改變經濟學研究范式?》,《管理世界》第10期。

      胡開寶,尚文博 2022 《語言學與語言智能》,《華東師范大學學報(哲學社會科學版)》第2期。

      胡開寶,田緒軍 2020 《語言智能背景下的MTI人才培養(yǎng):挑戰(zhàn)、對策與前景》,《外語界》第2期。

      黃少安 2015 《交易成本節(jié)約與民族語言多樣性需求的矛盾及其化解》,《天津社會科學》第1期。

      李海艦,趙 麗 2021 《數據成為生產要素:特征、機制與價值形態(tài)演進》,《上海經濟研究》第8期。

      李 艷 2017 《基于大語言產業(yè)觀的語言培訓業(yè)供給側治理思考》,《語言戰(zhàn)略研究》第5期。

      李宇明 2012 《認識語言的經濟屬性》,《語言文字應用》第3期。

      李宇明 2019 《語言產業(yè)研究的若干問題》,《江蘇師范大學學報》(哲學社會科學版)第2期。

      李宇明 2020 《數據時代與語言產業(yè)》,《山東師范大學學報(社會科學版)》,第5期。

      李宇明,王春輝 2022 《從數據到語言數據》,《語言戰(zhàn)略研究》第4期。

      劉國輝,張衛(wèi)國 2016 《中國城市勞動力市場中的“語言經濟學”:外語能力的工資效應研究》,《山東大學學報(哲學社會科學版)》第2期。

      劉平峰,張 旺 2021 《數字技術如何賦能制造業(yè)全要素生產率》,《科學學研究》第8期。

      任轉轉,鄧 峰 2022 《數字技術、要素結構轉型與經濟高質量發(fā)展》,《軟科學》,https://kns.cnki.net/kcms/detail/51.1268.G3.20220330.1813.002.html。

      宋景堯 2019 《語言經濟學研究路徑的演變與信息經濟學視角下的新探索》,《山東大學學報(哲學社會科學版)》第4期。

      蘇 劍 2014 《語言產業(yè)對我國經濟增長貢獻率的定量估算》,《社會科學家》第4期。

      王海蘭 2017 《語言多樣性與經濟發(fā)展的互動關系分析》,《制度經濟學研究》第4期。

      王海蘭 2018 《語言人力資本推動經濟增長的作用機制研究》,《語言戰(zhàn)略研究》第2期。

      王 凱 2021 《數字經濟、資源配置與產業(yè)結構優(yōu)化升級》,《金融與經濟》第4期。

      易憲容,陳穎穎,位玉雙 2019 《數字經濟中的幾個重大理論問題研究——基于現代經濟學的一般性分析》,《經濟學家》第7期。

      張 勉 2007 《移動通信技術的發(fā)展歷史及趨勢》,《電腦與電信》第9期。

      張衛(wèi)國 2008 《作為人力資本、公共產品和制度的語言:語言經濟學的一個基本分析框架》,《經濟研究》第2期。

      趙世舉,葛新宇 2017 《語言經濟學的維度及視角》,《武漢大學學報(人文科學版)》第6期。

      Chiswick, B. R. 1991. Speaking, reading, and earnings among low-skilled immigrants. 9(2), 149–170.

      Grenier, G. 1984. The effects of language characteristics on the wages of Hispanic-American males. 1(19), 35–52.

      Grin, F. 2003. Language planning and economics. 4(1), 1–66.

      Ku, H. & A. Zussman. 2010. Lingua franca: The role of English in international trade. 75(2), 250–260.

      Marschak, J. 1965. Economics of language. 10(2), 135–140.

      責任編輯:逯琳琳

      參見中國信息通信研究院《全球數字經濟白皮書——疫情沖擊下的復蘇新曙光》,http://www.caict.ac.cn/kxyj/qwfb/bps/202108/t20210802_381484.htm。

      參見中國信息通信研究院《中國數字經濟發(fā)展白皮書》,http://www.caict.ac.cn/kxyj/qwfb/bps/202104/t20210423_374626.htm。

      參見中國信息通信研究院《數據基礎設施白皮書2019》,http://www.caict.ac.cn/kxyj/qwfb/bps/201911/t20191118_269749.htm。

      參見中國信息通信研究院《中國數字經濟發(fā)展白皮書》(2020年),http://www.caict.ac.cn/kxyj/qwfb/bps/202007/t20200702_285535.htm。

      參見中國信息通信研究院《中國數字經濟就業(yè)發(fā)展研究報告:新形態(tài)、新模式、新趨勢》,http://www.caict.ac.cn/kxyj/qwfb/ztbg/202007/t20200728_287278.htm。

      參見中國信息通信研究院《中國數字經濟就業(yè)發(fā)展研究報告:新形態(tài)、新模式、新趨勢》, http://www.caict.ac.cn/kxyj/qwfb/ztbg/202007/t20200728_287278.htm。

      參見中國信息通信研究院《中國數字經濟發(fā)展白皮書》(2020年),http://www.caict.ac.cn/kxyj/qwfb/bps/202007/t20200702_285535.htm。

      參見李艷,賀宏志《大力發(fā)展語言產業(yè) 服務國家語言戰(zhàn)略》,《中國教育報》,2020年10月10日第3版。

      猜你喜歡
      數字經濟
      數字化—數字經濟及其它
      中文信息(2017年8期)2017-08-31 22:45:05
      數字經濟環(huán)境下中國跨境貿易稅收問題研究
      工業(yè)互聯網發(fā)展態(tài)勢及政策建議
      開放導報(2017年2期)2017-04-20 15:52:09
      數字經濟時代國際稅法的改革
      法制與社會(2017年9期)2017-04-18 11:16:06
      國外數字經濟戰(zhàn)略的供給側實施路徑及對中國的啟示
      一起來認識“數字經濟”
      大眾科學(2017年3期)2017-03-21 23:10:18
      OECD國家數字經濟戰(zhàn)略的經驗和啟示
      從數字經濟視角解讀歐亞經濟聯盟與絲綢之路經濟帶對接
      數字經濟對CFC規(guī)則的沖擊探究
      中國市場(2016年37期)2016-11-12 03:35:26
      應對數字經濟下的BEPS現象
      商(2016年25期)2016-07-29 22:05:59
      德庆县| 高碑店市| 皮山县| 黄陵县| 岳阳县| 无锡市| 赣榆县| 阿坝县| 天等县| 汾阳市| 南开区| 宁明县| 泸州市| 克东县| 扶风县| 南康市| 赤峰市| 丽江市| 万宁市| 专栏| 从江县| 漳浦县| 泸定县| 开封县| 新营市| 蓬安县| 贡山| 枣强县| 获嘉县| 陇川县| 疏附县| 阜康市| 晋州市| 个旧市| 安仁县| 峨眉山市| 安平县| 沾化县| 司法| 南漳县| 五台县|