• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      ChatGPT 對數(shù)字人文研究的影響芻議

      2023-10-02 14:59:36李少建中國人民大學(xué)信息資源管理學(xué)院中國人民大學(xué)數(shù)字人文研究院
      浙江檔案 2023年7期
      關(guān)鍵詞:人文數(shù)字文本

      李少建/中國人民大學(xué)信息資源管理學(xué)院 中國人民大學(xué)數(shù)字人文研究院

      1 引言

      ChatGPT是由OpenAI開發(fā)的一種基于深度學(xué)習(xí)的自然語言處理模型,它使用了一個名為Transformer的神經(jīng)網(wǎng)絡(luò)架構(gòu),該架構(gòu)利用了自注意力機制,能夠很好地處理自然語言的語義和上下文關(guān)系。經(jīng)過訓(xùn)練,ChatGPT能夠生成自然流暢的文本,并在各種應(yīng)用中展現(xiàn)出驚人的效果,已被廣泛應(yīng)用于各種場景,如自動化寫作、機器翻譯、智能客服等,是一個具有巨大潛力的自然語言處理模型。數(shù)字人文(Digital Humanities,DH),源于人文計算(Humanities Computing),是在計算機技術(shù)、網(wǎng)絡(luò)技術(shù)、多媒體技術(shù)等新興技術(shù)支撐下開展人文研究而形成的新型跨學(xué)科研究領(lǐng)域[1]。在數(shù)字人文研究中,研究者通常需要處理大量的文本數(shù)據(jù),包括文學(xué)作品、歷史文獻、社交媒體數(shù)據(jù)等。這些文本數(shù)據(jù)的分析和解釋需要一定的語言理解和生成能力,而ChatGPT恰好在這方面展現(xiàn)出了強大的應(yīng)用價值。ChatGPT可以用于文本生成、摘要、文本分類、機器翻譯等多種任務(wù),這些任務(wù)都是數(shù)字人文研究中常見的步驟與過程。ChatGPT作為一種強大的語言模型,為數(shù)字人文研究提供了新的思路和方法,同樣它也給數(shù)字人文研究帶來了挑戰(zhàn)。

      2 研究回顧

      ChatGPT作為GPT技術(shù)在對話生成任務(wù)上的應(yīng)用,其發(fā)展伴隨著自然語言處理技術(shù)的發(fā)展而不斷完善和優(yōu)化。ChatGPT采用了Transformer模型、思維鏈、基于人類反饋的強化學(xué)習(xí)等技術(shù),并且從GPT-1到GPT-4,其模型的規(guī)模呈現(xiàn)指數(shù)級增大,訓(xùn)練數(shù)據(jù)也愈發(fā)豐富,同時其性能和表現(xiàn)也在每一次升級中得到了顯著的改進,不斷擴充其在各種應(yīng)用場景的巨大潛力。自2023年1月至5月底,中國知網(wǎng)上的期刊論文中已發(fā)表530余篇ChatGPT的相關(guān)論文,報紙文章560余篇,可見相關(guān)話題的熱度之高。相關(guān)論文涉及面很廣,但多以探討ChatGPT對各行業(yè)帶來的影響為主,如郭瀟雅、孔祥勇[2-3]等論及醫(yī)療行業(yè),徐敬宏、沈衛(wèi)星[4-5]等論及出版行業(yè),劉妍、吳青[6-7]等論及教育行業(yè),曾雄、李燕[8-9]等論及金融行業(yè),舒洪水、文婷[10-11]等論及法律行業(yè)。信息資源管理領(lǐng)域的相關(guān)熱議有蔡迎春、趙瑞雪[12-13]等討論了ChatGPT對圖書館的影響。曹樹金、尹克寒[14-15]等討論了ChatGPT對情報學(xué)的影響。周文歡[16]討論了ChatGPT在檔案文本摘要,檔案分類等方面的作用。陸偉[17]等人論述了ChatGPT為代表的大模型對信息資源管理的影響。葉鷹等人[18]闡述了GPT類技術(shù)對數(shù)字人文在語料庫建設(shè),文本分析,文本生成,跨語言處理方面的技術(shù)支持以及在創(chuàng)意寫作與生成藝術(shù),語言學(xué)研究,文化遺產(chǎn)保護,語義網(wǎng)絡(luò)構(gòu)建等方面的拓展影響。但該文是從宏觀視角闡述了GPT類技術(shù)對數(shù)字人文重塑,而本文旨在從微觀視角入手,以朱本軍,聶華[19]對全球“數(shù)字人文”項目實踐的梳理和歸納總結(jié)得出的4個數(shù)字人文研究的主要內(nèi)容入手,分析ChatGPT為數(shù)字人文研究帶來的影響。

      3 ChatGPT為數(shù)字人文研究提供的機遇

      3.1 人文數(shù)據(jù)庫或數(shù)據(jù)集建設(shè)

      ChatGPT的出現(xiàn)對人文數(shù)據(jù)庫或數(shù)據(jù)集的建設(shè)方面產(chǎn)生了積極影響。首先,它為人文數(shù)據(jù)庫和數(shù)據(jù)集的建設(shè)提供了新的工具和技術(shù),使數(shù)字人文研究得以更加深入和全面地開展。將非數(shù)字的人文資料加工轉(zhuǎn)化為數(shù)字內(nèi)容,對非結(jié)構(gòu)化的數(shù)字文本內(nèi)容按照某種使用目的進行規(guī)范化標注著錄的數(shù)據(jù)集建設(shè),這兩項工作是數(shù)字人文研究的前期基礎(chǔ),是數(shù)字人文研究內(nèi)容的重要來源之一。其次,GPT-4作為一個大型多模態(tài)模型,可以支持對多模態(tài)數(shù)據(jù)載體的處理,如對非結(jié)構(gòu)化、半結(jié)構(gòu)化文本進行結(jié)構(gòu)化處理,從而為研究內(nèi)容的數(shù)據(jù)化,以及數(shù)據(jù)集的建設(shè)提供便利。在數(shù)字人文研究領(lǐng)域中,許多項目和研究需要處理大量文本數(shù)據(jù),例如歷史文獻、數(shù)據(jù)集、語料庫等等,同時不少數(shù)字人文項目涉及多模態(tài),ChatGPT可以作為一種有效的工具來處理這些數(shù)據(jù),并且可以通過對這些數(shù)據(jù)的學(xué)習(xí)來生成新的文本內(nèi)容。再次,ChatGPT可以利用其強大的自然語言理解和生成能力,為非結(jié)構(gòu)化數(shù)字文本內(nèi)容提供高質(zhì)量的摘要、標題、關(guān)鍵詞等元數(shù)據(jù)信息。同時也可以根據(jù)不同的研究主題和需求,為非結(jié)構(gòu)化數(shù)字文本內(nèi)容進行智能分類和聚類,形成不同領(lǐng)域或子領(lǐng)域的數(shù)據(jù)集。通過ChatGPT建設(shè)的高質(zhì)量數(shù)據(jù)集可以提高人文數(shù)據(jù)的可視化和交互性,使其更容易被分析和理解,同時也降低了數(shù)字技術(shù)對人文研究者的門檻。

      3.2 人文數(shù)字工具的開發(fā)使用

      數(shù)字工具和平臺在數(shù)字人文研究中所起的作用主要是處理低水平重復(fù)的工作,如資料查找、文本比對、文本標記等,將人文學(xué)者從“體力勞動”中解放出來,讓其將精力放在更高深的人文問題研究中[20],這一方面ChatGPT無疑展現(xiàn)了其巨大價值。另外使用或設(shè)計非人文領(lǐng)域研究方法的數(shù)字工具來理解和分析數(shù)據(jù)集。常見工具方法有社會網(wǎng)絡(luò)分析,地理信息系統(tǒng),知識圖譜等,如社會網(wǎng)絡(luò)分析(Social Network Analysis,SNA)是對社會網(wǎng)絡(luò)中各種關(guān)系結(jié)構(gòu)及其屬性加以分析的一套理論和方法,它主要分析的是行動者之間的關(guān)系模式[21]。當(dāng)前數(shù)字人文研究中運用社會網(wǎng)絡(luò)語分析來處理歷史人物的親屬關(guān)系或社會關(guān)系的研究已十分常見。在社會網(wǎng)絡(luò)分析中,最基礎(chǔ)也是最重要的信息就是社會網(wǎng)絡(luò)關(guān)系中的節(jié)點與邊,節(jié)點即為要分析的具體對象,邊即為對象與對象之間的聯(lián)系。通過ChatGPT,可以快速獲取相關(guān)的節(jié)點與邊的數(shù)據(jù),并將其導(dǎo)入gephi、ucinet等社會網(wǎng)絡(luò)分析工具中,從而得到對應(yīng)的社會網(wǎng)絡(luò)。以《紅樓夢》社會網(wǎng)絡(luò)關(guān)系構(gòu)建為例,通過ChatGPT快速構(gòu)建紅樓夢社會網(wǎng)絡(luò)關(guān)系的步驟。第一步是提取《紅樓夢》中的人物信息,并將人物轉(zhuǎn)化成社會網(wǎng)絡(luò)關(guān)系中節(jié)點,通過提問可快速從ChatGPT處得到相關(guān)信息,并且可通過重復(fù)要求和訓(xùn)練從而更加全面地獲取紅樓夢中主要人物信息。第二步是構(gòu)建社會網(wǎng)絡(luò)關(guān)系中的邊,也即第一步所得到的人物與人物之間的關(guān)系。至此構(gòu)建《紅樓夢》社會網(wǎng)絡(luò)關(guān)系的基本信息已獲取,由于經(jīng)過指令,ChatGPT輸出的信息都是較為規(guī)范的結(jié)構(gòu)化數(shù)據(jù),因此可以將詢問ChatGPT所得信息復(fù)制下來保存為txt文本,再通過ChatGPT生成代碼將文本批量轉(zhuǎn)換為人物與人物之間關(guān)系的CSV文件,最后將得到的CSV文件導(dǎo)入至neo4j中即可得到《紅樓夢》的社會網(wǎng)絡(luò)關(guān)系。采用ChatGPT大大減少數(shù)字人文研究中運用社會網(wǎng)絡(luò)分析方法時獲取基礎(chǔ)數(shù)據(jù)較為麻煩的問題,以及解決部分研究者因并未同時掌握python、neo4j、gephi等相關(guān)技術(shù)工具而無法完成一個完整的數(shù)字人文研究的問題,大大提升研究的效率和質(zhì)量,拓寬研究的視角與方法。

      3.3 人文研究方法和研究范式

      數(shù)字人文研究將人文學(xué)者較多采用的定性研究轉(zhuǎn)變?yōu)槎ㄐ匝芯颗c定量研究相輔助的形式。而ChatGPT可以幫助人文學(xué)者利用機器學(xué)習(xí)和自然語言處理等技術(shù),幫助人文學(xué)者探索和分析大量的文本數(shù)據(jù),將定性研究與定量研究相結(jié)合,從更多的角度和維度開展人文相關(guān)的研究。改變傳統(tǒng)通?;谌斯俗⒑褪謩臃治龅奈谋痉治龇椒?,可以通過機器學(xué)習(xí)和自然語言處理技術(shù),實現(xiàn)自動處理和分析大量的文本數(shù)據(jù)。這種自動化的文本分析方法可以為人文學(xué)者提供更快捷、更全面、更準確地分析結(jié)果。比如ChatGPT可以對大量的文本數(shù)據(jù)進行分析和建模,識別和提取文本中的主題和話題,對文本進行分類,幫助人文學(xué)者批量發(fā)現(xiàn)、理解和處理文本中的主題,了解文本的情感色彩和情感變化,以便進行定性和定量分析。其次,ChatGPT還能幫助運用知識圖譜和關(guān)系建模開展相關(guān)研究,例如使用實體識別和關(guān)系提取技術(shù)來識別文本中的實體和關(guān)系,組織和表示大量的文本數(shù)據(jù),幫助人文學(xué)者發(fā)現(xiàn)和理解文本中的關(guān)系和聯(lián)系以幫助人文學(xué)者構(gòu)建知識圖譜和進行關(guān)系分析。再次,其也可幫助人文學(xué)者進行數(shù)據(jù)可視化和交互分析,ChatGPT可以使用各種數(shù)據(jù)可視化和交互分析工具來幫助人文學(xué)者理解和探索大量的文本數(shù)據(jù)。例如,ChatGPT可以幫助使用網(wǎng)絡(luò)圖和熱力圖等可視化工具來展示文本中的關(guān)系和變化,以幫助人文學(xué)者發(fā)現(xiàn)和理解文本中的模式和趨勢。這種結(jié)合可以為人文學(xué)者帶來新的研究方法和研究范式,從而促進人文學(xué)科的創(chuàng)新和發(fā)展。

      3.4 人文領(lǐng)域的創(chuàng)造性破壞與建設(shè)

      作為創(chuàng)新的兩種類型,延續(xù)性創(chuàng)新與創(chuàng)造性破壞(Creative Destruction)在范式演進的全鏈條中交替發(fā)生作用,后者是前者與需求側(cè)矛盾轉(zhuǎn)化的自然結(jié)果[22]。創(chuàng)造性破壞是人類進步的常態(tài),在數(shù)字人文領(lǐng)域,這種“破壞”帶來的不是文化之死,而是更為多彩的文化[23]。作為一種先進的人工智能技術(shù),ChatGPT的出現(xiàn)與數(shù)字人文的出現(xiàn),在某種程度上都是顛覆傳統(tǒng)的,而如果再將二者相結(jié)合,那必定會碰撞出更具有顛覆性的火花。首先從傳統(tǒng)人文研究的內(nèi)容角度上而言,數(shù)字人文研究可以對其進行知識重組與知識庫構(gòu)建。如中國歷代人物傳記資料庫(China Biographical Database,CBDB),由哈佛大學(xué)費正清中國研究中心、臺灣中央研究院歷史語言研究所及北京大學(xué)中國古代史研究中心三方合作進行,系統(tǒng)性地收入中國歷史上所有重要的傳記資料,截至2022年8月為止,共收錄約五十二萬余人的傳記資料,這些人物主要出自七世紀至十九世紀。就傳統(tǒng)人文研究的方式而言,學(xué)者窮盡一生也許都難以從各種書中閱覽完這些人物傳記資料。ChatGPT作為一種基于人工智能技術(shù)的語言模型,可以通過大規(guī)模的語料庫訓(xùn)練,傳統(tǒng)的人文研究需要大量的人力和時間進行文本分析和研究,而ChatGPT可以通過自動化的文本分析技術(shù),快速地分析和理解大量的文本數(shù)據(jù),從而挖掘出隱藏在文本中的知識和信息。同時傳統(tǒng)的人文研究往往受限于數(shù)據(jù)的規(guī)模和質(zhì)量,而ChatGPT可以通過大規(guī)模的數(shù)據(jù)處理和分析,挖掘出更多的知識和信息。

      傳統(tǒng)人文研究的思路角度上,ChatGPT可以為相關(guān)數(shù)字人文研究提供研究的思路與靈感,通過分析和學(xué)習(xí)大量的文學(xué)、藝術(shù)、社會、文化等方面的數(shù)據(jù),ChatGPT可以自動生成一些新的、具有創(chuàng)造性的文化、社會、藝術(shù)、文學(xué)等內(nèi)容,提供一些素材、構(gòu)思、情節(jié)等方面的支持,激發(fā)人文學(xué)者的想象力和創(chuàng)造性,為研究者提供一些新的創(chuàng)意和靈感。同時也可以直接利用ChatGPT在文學(xué)、藝術(shù)等領(lǐng)域中,如AI寫詩與AI繪畫等。ChatGPT可以生成自然語言文本,例如可以根據(jù)用戶輸入的數(shù)據(jù)生成詩歌、散文、小說等文學(xué)作品,或者模擬人物對話、寫作等場景。但需要注意的是,ChatGPT目前還存在一些限制和局限性,例如在文學(xué)、藝術(shù)等領(lǐng)域中,它仍然難以完全替代人類的創(chuàng)作和審美能力。因此,ChatGPT在數(shù)字人文領(lǐng)域的創(chuàng)造性破壞與建設(shè)方面,還需要不斷地探索和優(yōu)化以發(fā)揮更大的作用。

      4 ChatGPT給數(shù)字人文研究帶來的挑戰(zhàn)

      4.1 對數(shù)字人文從業(yè)者的挑戰(zhàn)

      ChatGPT在數(shù)字人文領(lǐng)域的廣泛應(yīng)用,給數(shù)字人文從業(yè)者帶來了一系列挑戰(zhàn)。雖然ChatGPT所帶來的顯著特點在于自動化取代人工的趨勢更甚,但是數(shù)字人文從業(yè)者需要意識到,在這個數(shù)字化、智能化的時代,他們的職業(yè)生涯需要不斷地適應(yīng)和調(diào)整。首先,ChatGPT可以通過自動化的文本分析技術(shù),快速地分析和理解大量的文本數(shù)據(jù),從而取代了一部分需要人工分析和研究的工作,尤其是文字與編輯方面的工作,數(shù)字人文相關(guān)從業(yè)者可能會面臨職業(yè)轉(zhuǎn)型的壓力。因此,他們需要及時提升個人能力,擁抱數(shù)字技術(shù),以適應(yīng)新形勢下完成相應(yīng)任務(wù)的更高要求與更多方法。其次,隨著人工智能與人文學(xué)科的交叉的不斷深入,數(shù)字人文從業(yè)者需要具備跨學(xué)科的知識和技能,以便于將人工智能技術(shù)應(yīng)用到相應(yīng)人文學(xué)科領(lǐng)域中。他們需要不斷學(xué)習(xí)和更新知識,以滿足不斷變化的需求。同時數(shù)字人文從業(yè)者需要注意避免技術(shù)依賴,不能過度依賴ChatGPT等語言模型技術(shù),從而導(dǎo)致技術(shù)上的困境和瓶頸,影響數(shù)字人文領(lǐng)域的創(chuàng)新和發(fā)展。最后,數(shù)字人文從業(yè)者需要意識到人文學(xué)科的價值和意義,不能將數(shù)字技術(shù)完全取代人文學(xué)科的研究方法和思維方式,否則可能會損害數(shù)字人文領(lǐng)域的價值和意義。數(shù)字人文從業(yè)者需要認識到,數(shù)字技術(shù)的發(fā)展需要與人文學(xué)科的研究相結(jié)合,以推動數(shù)字人文領(lǐng)域的創(chuàng)新和發(fā)展。他們需要不斷地探索和創(chuàng)新,以滿足不同領(lǐng)域的需求。只有這樣,數(shù)字人文從業(yè)者才能在這個數(shù)字化時代中保持競爭力,為數(shù)字人文領(lǐng)域的發(fā)展作出更大的貢獻。

      4.2 對數(shù)字人文教育的挑戰(zhàn)

      ChatGPT的出現(xiàn)對數(shù)字人文教育也將帶來一些沖擊。首先,數(shù)字人文教育需要重新審視其教學(xué)目標和方法。隨著其智能化程度的不斷發(fā)展,應(yīng)用場景的不斷拓展,技術(shù)工具在數(shù)字人文研究中的應(yīng)用將逐漸普遍化和低門檻化,使人文研究從過去以資源占有為決定性因素,轉(zhuǎn)變?yōu)槿缃褚蕴岢鰡栴}的想象力為驅(qū)動的“第四范式”[24]。因此,數(shù)字人文教育需更注重培養(yǎng)學(xué)生的創(chuàng)新能力,使其能在思維創(chuàng)新和創(chuàng)造力層面超越人工智能。其次,數(shù)字人文教育需要不斷更新和調(diào)整課程內(nèi)容,以應(yīng)對新技術(shù)和工具的應(yīng)用。ChatGPT等自然語言處理技術(shù)的出現(xiàn)意味著數(shù)字人文教育需更深入地探索和應(yīng)用這些技術(shù),以幫助學(xué)生更好地理解和應(yīng)用這些新技術(shù)。數(shù)字人文教育還需要將數(shù)字技術(shù)和傳統(tǒng)的人文學(xué)科知識相互結(jié)合,以提高學(xué)生的綜合素質(zhì)。再次,數(shù)字人文教師的角色也將發(fā)生變化。數(shù)字人文教育的發(fā)展可能使得教師需要更多地擔(dān)任指導(dǎo)和輔導(dǎo)的角色,而不是傳統(tǒng)的講授和評估的角色。教師需要更加注重學(xué)生的個性化需求和學(xué)習(xí)能力,以幫助他們更好地掌握數(shù)字人文技術(shù)和工具,并發(fā)揮其創(chuàng)新能力。數(shù)字人文教師還需要不斷地學(xué)習(xí)和更新自己的知識和技能,以適應(yīng)數(shù)字時代數(shù)字人文教育的發(fā)展。最后,數(shù)字鴻溝將擴大。數(shù)字技術(shù)和工具的應(yīng)用和普及程度不同將導(dǎo)致數(shù)字鴻溝的擴大,一些學(xué)生和教師可能由于主觀或客觀的原因,無法充分利用數(shù)字人文教育所提供的機會和資源,數(shù)字人文教育需要更加注重教育公平,為每個學(xué)生提供平等的機會和資源,以便于他們掌握數(shù)字人文技術(shù)和工具,從而更好地開展數(shù)字人文研究。

      5 結(jié)語

      ChatGPT技術(shù)的發(fā)展為數(shù)字人文研究帶來了廣泛的應(yīng)用前景,它是建立在海量語料庫的基礎(chǔ)上進行訓(xùn)練的人工智能技術(shù),其實現(xiàn)了對人類語言能力的高度還原,同時在經(jīng)過千千萬萬人的會話微調(diào)后,其性能不斷提高,更加貼近于人類的認知習(xí)慣。但ChatGPT的強大并沒有什么理論的創(chuàng)新,也沒有構(gòu)造多巧妙的算法,其能力來自人工神經(jīng)網(wǎng)絡(luò)規(guī)模達到數(shù)百億之后出現(xiàn)的復(fù)雜系統(tǒng)涌現(xiàn)現(xiàn)象,至于其實現(xiàn)的原理尚未可知。約翰·霍蘭作為涌現(xiàn)理論奠基人,他是公認的“遺傳算法之父”,他曾指出涌現(xiàn)現(xiàn)象也會在那些至今幾乎還沒有什么規(guī)律可循的領(lǐng)域中發(fā)生[25],而ChatGPT就是一個生動的例子。但ChatGPT一個最大的缺點在于其無法保證生成內(nèi)容的準確性與真實性,有時生成的內(nèi)容完全是胡編亂造。在最近發(fā)表于《Nature》上的文章《ChatGPT:五個重要的研究問題》中,研究者指出,如果將ChatGPT用于科學(xué)界,必須堅持人類審查的原則。同樣,在數(shù)字人文研究中使用ChatGPT也必須保證有人對其進行人工審核和糾正。我們需要充分認識到其應(yīng)用的潛力和限制,不斷提高我們的技術(shù)和方法水平,以更好地應(yīng)用ChatGPT技術(shù)開展數(shù)字人文研究。

      猜你喜歡
      人文數(shù)字文本
      人文
      北京紀事(2024年1期)2024-01-03 03:16:55
      在808DA上文本顯示的改善
      基于doc2vec和TF-IDF的相似文本識別
      電子制作(2018年18期)2018-11-14 01:48:06
      答數(shù)字
      人文紹興
      中國三峽(2017年3期)2017-06-09 08:14:59
      數(shù)字看G20
      人文社科
      全國新書目(2016年5期)2016-06-08 08:54:10
      文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
      讓人文光輝照耀未來
      成雙成對
      松滋市| 无极县| 恩施市| 昆山市| 连平县| 兴义市| 榆林市| 尚义县| 江山市| 房产| 竹山县| 鹿邑县| 甘德县| 尼勒克县| 晴隆县| 墨竹工卡县| 永济市| 宁城县| 中西区| 肃宁县| 远安县| 墨竹工卡县| 扶沟县| 北碚区| 铜陵市| 大兴区| 太和县| 海宁市| 读书| 攀枝花市| 曲麻莱县| 南京市| 丽水市| 阿瓦提县| 梓潼县| 武陟县| 绥棱县| 渝中区| 科技| 尼木县| 保德县|