李 悅 李子運(yùn)
(江蘇師范大學(xué),江蘇徐州 221000)
人工智能已然成為當(dāng)今最熱門的研究領(lǐng)域之一,在人工智能的眾多應(yīng)用領(lǐng)域中,自然語言處理技術(shù)顯得尤為重要。自然語言處理是(Natural Language Processing,NLP)指將人類自然語言轉(zhuǎn)化為機(jī)器可讀的形式,以便計(jì)算機(jī)可以理解和處理,而且自然語言處理研究實(shí)現(xiàn)人與計(jì)算機(jī)之間用自然語言進(jìn)行交流的各種理論和方法,是計(jì)算機(jī)科學(xué)領(lǐng)域與人工智能領(lǐng)域中的一個(gè)重要方向[1]。人工智能寫作也是人工智能發(fā)展的重要產(chǎn)物,按照其智能化程度可以進(jìn)一步細(xì)分為自動(dòng)寫作和輔助寫作[2]。在這方面,ChatGPT 預(yù)訓(xùn)練語言模型因其優(yōu)秀的表現(xiàn)在學(xué)術(shù)問題求解過程中備受關(guān)注。
20世紀(jì)60年代,人工智能領(lǐng)域的第一次發(fā)展高潮出現(xiàn),孕育出自然語言處理和人機(jī)對(duì)話技術(shù)。70 年代開始,基于統(tǒng)計(jì)的方法逐漸代替了基于規(guī)則的方法。90 年代中期以來,計(jì)算機(jī)的運(yùn)行速度和存儲(chǔ)量大幅度增加,為自然語言處理技術(shù)的飛速發(fā)展提供了硬件基礎(chǔ)[3]。本文通過對(duì)ChatGPT 在學(xué)術(shù)問題求解過程中的應(yīng)用進(jìn)行分析,探討其實(shí)現(xiàn)過程、應(yīng)用效果和未來發(fā)展方向,為研究和應(yīng)用ChatGPT 在學(xué)術(shù)問題求解領(lǐng)域的讀者提供參考和借鑒。學(xué)術(shù)問題的解決是科研工作者和學(xué)者生活中重要的研究行為。依托于人工閱讀大量的書籍文獻(xiàn)和資料,不僅費(fèi)時(shí)費(fèi)力,而且會(huì)很容易出現(xiàn)漏洞,Chat-GPT 作為自然語言處理領(lǐng)域的一個(gè)重要模型,其在解決學(xué)術(shù)問題中具有獨(dú)特的優(yōu)勢。
ChatGPT 是一種由OpenAI 所推出的基于Transformer 結(jié)構(gòu)的預(yù)訓(xùn)練語言模型,它在2018年被首次提出,目前已經(jīng)發(fā)展到了第三代。
與傳統(tǒng)的神經(jīng)語言模型不同,ChatGPT 利用了Transformer 結(jié)構(gòu)中的自注意力機(jī)制,能夠更好地捕捉句子中的上下文關(guān)系。ChatGPT 模型的預(yù)訓(xùn)練過程主要分為兩個(gè)階段,分別是語言建模和文本生成。在語言建模階段,模型使用海量的未標(biāo)注文本數(shù)據(jù)進(jìn)行訓(xùn)練,學(xué)習(xí)對(duì)語言的理解。在文本生成階段,模型通過對(duì)一個(gè)給定的前綴文本進(jìn)行自動(dòng)生成,進(jìn)一步提高其語言生成的能力。而且,ChatGPT 在自然語言處理中也有著廣泛的應(yīng)用,如文本分類、情感分析、機(jī)器翻譯和問答系統(tǒng)等。與此同時(shí),在學(xué)術(shù)領(lǐng)域中,ChatGPT是基于transformer模型的一種自然語言處理技術(shù)。該技術(shù)主要包括三個(gè)部分:輸入編碼、transformer 模型和輸出解碼。輸入編碼主要負(fù)責(zé)將輸入的自然語言文本進(jìn)行編碼,轉(zhuǎn)換為計(jì)算機(jī)可以理解的向量形式;transformer 模型主要負(fù)責(zé)對(duì)輸入的文本進(jìn)行理解和推理,并生成相應(yīng)的輸出;輸出解碼主要負(fù)責(zé)將輸出向量轉(zhuǎn)換為自然語言文本,使得用戶可以方便地閱讀和理解。
語言文化存在著差異,當(dāng)前市面上混雜著各式各樣的單一語言的系統(tǒng)軟件。在任何一種系統(tǒng)中,開發(fā)多種語言字體的支持環(huán)境勢在必行。這不僅滿足國際化市場的需要,也是系統(tǒng)軟件自身發(fā)展的趨勢[4]。由于ChatGPT 在預(yù)訓(xùn)練階段就是采用的無標(biāo)注的文本數(shù)據(jù),所以能夠很好地適應(yīng)不同語種的文字。因此,ChatGPT在跨語言、跨文化的傳播方面有著巨大的潛在價(jià)值,將會(huì)使其在更廣闊的領(lǐng)域中得到更多應(yīng)用。
ChatGPT 可以用于對(duì)話系統(tǒng)中,通過生成自然語言來回答用戶的提問,實(shí)現(xiàn)智能對(duì)話。比如,可以使用ChatGPT 來構(gòu)建聊天機(jī)器人,實(shí)現(xiàn)智能客服、問答等場景。也可以用于生成代碼。例如,可以輸入自然語言描述的任務(wù)要求,ChatGPT 會(huì)生成相應(yīng)的代碼,自動(dòng)實(shí)現(xiàn)任務(wù)。但也只限于文本式的輸入形式,無法達(dá)到對(duì)圖片類數(shù)據(jù)的識(shí)別和解析。
智能問答系統(tǒng)是一種能夠理解用戶提出的用自然語言表述的問題,并能夠自動(dòng)、準(zhǔn)確地給出用戶答案的軟件系統(tǒng)[5]。ChatGPT 便是一個(gè)基于自然語言處理技術(shù)的問答系統(tǒng),可以回答用戶的各式各樣問題。
它的應(yīng)用場景包括但不限于以下幾個(gè)方面:一是常識(shí)性問題:ChatGPT 可以回答與日常生活、科技、文化等領(lǐng)域相關(guān)的常識(shí)性問題,例如“太陽為什么會(huì)發(fā)光?”“中國的首都是哪里?”二是搜索性問題:ChatGPT 可以根據(jù)用戶的提問,在網(wǎng)絡(luò)上搜索相關(guān)的信息,并給出相應(yīng)的答案,例如“如何瘦身?”“如何學(xué)習(xí)編程?”三是對(duì)話式問題:ChatGPT 可以與用戶進(jìn)行自然的對(duì)話,例如“你好”“今天天氣怎么樣?”四是語言翻譯:ChatGPT 可以將一種語言翻譯成另一種語言,例如將英文翻譯成中文或者將中文翻譯成英文等。
總之,ChatGPT 是一款功能強(qiáng)大的問答系統(tǒng),其經(jīng)過大量的語料庫訓(xùn)練,具有廣泛的知識(shí)儲(chǔ)備,能夠?qū)Χ囝I(lǐng)域的問題進(jìn)行回答,可以為用戶提供全方位、多樣化的信息和服務(wù)。
問題提出是學(xué)術(shù)問題求解過程的第一步。在這個(gè)環(huán)節(jié)中,需要明確問題的研究領(lǐng)域和問題的具體內(nèi)容。而問題理解的關(guān)鍵在于問題語義特征的提取和表示,以此來明確用戶所提出的自然語言問題的真實(shí)意圖[6]。ChatGPT 擅長于理解自然語言,并能夠提供與之相關(guān)的信息,但它需要用清晰、精確的語言描述準(zhǔn)確的問題才能提供有效的回答。而且,在輸入問題之前,用戶需要對(duì)所詢問的問題進(jìn)行足夠的思考,并盡可能提供其詳細(xì)的背景信息,只有這樣Chat-GPT 才能給出有用的答案。此外,ChatGPT 可能會(huì)對(duì)問題進(jìn)行重述,以確保它正確理解了用戶的意圖。問題重述通常是為了使問題更加清晰,或者以不同的方式表達(dá)問題,以提高回答的質(zhì)量。例如,一個(gè)關(guān)于人工智能的問題可能是:“人工智能技術(shù)的現(xiàn)狀和發(fā)展趨勢是什么?”
在問題提出后,需要對(duì)問題進(jìn)行語言理解,將問題轉(zhuǎn)化為機(jī)器所能夠理解的形式。在自然語言處理幾十年的發(fā)展歷程中,文本表示方法經(jīng)歷了從離散符號(hào)表示到連續(xù)向量表示的體系轉(zhuǎn)變[7]。而ChatGPT 是一種基于神經(jīng)網(wǎng)絡(luò)的自然語言處理模型,它使用深度學(xué)習(xí)技術(shù)進(jìn)行語言理解。具體來說,ChatGPT 是一種預(yù)訓(xùn)練語言模型,它在大規(guī)模的文本數(shù)據(jù)集上進(jìn)行訓(xùn)練,以學(xué)習(xí)自然語言的規(guī)律和結(jié)構(gòu)。當(dāng)用戶輸入一個(gè)問題時(shí),ChatGPT 首先將其轉(zhuǎn)換為一個(gè)數(shù)字向量表示,并將其輸入到模型中。具體體現(xiàn)為:ChatGPT 使用詞嵌入技術(shù)將文本中的單詞或子詞(例如字母、詞根)映射到向量空間,以便模型能夠理解詞匯。然后,文本通過多層編碼器(通常是Transformer 編碼器)來捕獲不同層次的語義信息。編碼器是深度神經(jīng)網(wǎng)絡(luò)的一部分,它將輸入文本的每個(gè)位置上的詞嵌入進(jìn)行組合,以捕獲上下文信息。
模型還通過多個(gè)自注意力層和前饋網(wǎng)絡(luò)層對(duì)輸入進(jìn)行處理,以學(xué)習(xí)輸入序列中的上下文信息和語言規(guī)則。模型還可以考慮先前的對(duì)話歷史或上下文信息,以更好地理解用戶的問題。除此以外,在進(jìn)行語言理解時(shí),ChatGPT 還可以使用其他技術(shù)來提高其性能。ChatGPT 可以使用語言模型微調(diào)技術(shù)來進(jìn)一步改進(jìn)其對(duì)特定任務(wù)或領(lǐng)域的理解能力。還可以使用預(yù)處理技術(shù),例如分詞和去除停用詞,以減少輸入數(shù)據(jù)中的噪聲和冗余信息,從而提高模型的準(zhǔn)確性和效率。例如,ChatGPT 輸入“人工智能技術(shù)的現(xiàn)狀和發(fā)展趨勢是什么?”是機(jī)器無法理解的語言組織形式,可以將其改成“請(qǐng)描述人工智能技術(shù)目前的狀態(tài)和未來的發(fā)展趨勢?!?/p>
在語言理解后,需要對(duì)問題進(jìn)行知識(shí)檢索,獲取與問題相關(guān)的知識(shí)和信息。ChatGPT 是一個(gè)基于機(jī)器學(xué)習(xí)的自然語言處理模型,它的知識(shí)來自于被訓(xùn)練時(shí)接觸的文本數(shù)據(jù)。在訓(xùn)練期間,為ChatGPT 提供了大量的文本語料庫,例如維基百科、新聞報(bào)道、互聯(lián)網(wǎng)上的博客和論壇等,以學(xué)習(xí)和理解自然語言。在處理用戶的問題時(shí),ChatGPT 會(huì)使用一種稱為“前饋神經(jīng)網(wǎng)絡(luò)”的技術(shù)。用戶可以輸入檢索內(nèi)容,經(jīng)過語義理解將輸入內(nèi)容轉(zhuǎn)化為機(jī)器可識(shí)別的內(nèi)容[8]。這種技術(shù)將輸入的文本轉(zhuǎn)換為數(shù)字形式,然后使用預(yù)先訓(xùn)練好的模型來預(yù)測最可能的答案。ChatGPT 可以根據(jù)用戶提供的關(guān)鍵詞、問題或查詢來執(zhí)行基本的關(guān)鍵詞檢索操作。它可以搜索其預(yù)訓(xùn)練的文本語料庫,找到包含相關(guān)關(guān)鍵詞的文本段落或句子。接著,ChatGPT 可以從檢索到的文本中提取信息、事實(shí)或知識(shí)。它可以分析文本并識(shí)別其中的關(guān)鍵信息,然后將這些信息組織為回答問題或生成響應(yīng)的一部分。
模型的預(yù)測基于其先前接觸的文本數(shù)據(jù),以及對(duì)文本數(shù)據(jù)的理解和上下文的理解。當(dāng)用戶提出問題時(shí),ChatGPT 將嘗試在其訓(xùn)練數(shù)據(jù)中找到最相關(guān)的信息,并利用這些信息來生成一個(gè)回答。如果ChatGPT 無法找到相關(guān)的信息,則它可能會(huì)給出一個(gè)無法回答的答案或者詢問用戶是否需要更多信息。因此,ChatGPT 的知識(shí)檢索和回答生成能力是由其訓(xùn)練數(shù)據(jù)的質(zhì)量和數(shù)量決定的。針對(duì)此類問題,可以通過搜索引擎或?qū)W術(shù)數(shù)據(jù)庫等途徑獲取與該問題相關(guān)的研究文獻(xiàn)或知識(shí)點(diǎn)。
知識(shí)檢索后,需要將獲取到的知識(shí)和信息進(jìn)行答案生成,得到與問題相關(guān)的答案。在這個(gè)過程中,ChatGPT 模型可以通過生成式方法或選擇式方法進(jìn)行答案生成。這是通過深度學(xué)習(xí)模型和自然語言處理技術(shù)實(shí)現(xiàn)的,通常使用遞歸神經(jīng)網(wǎng)絡(luò)(如Transformer)的結(jié)構(gòu)來生成自然語言文本。而且ChatGPT 提供的回答可能包含多個(gè)信息來源和角度,需要仔細(xì)解讀并理解。如果回答不夠清晰或者不符合預(yù)期,可以嘗試重新提問或者重構(gòu)問題,以獲得更準(zhǔn)確和有用的回答。
在進(jìn)行答案生成時(shí),ChatGPT 可以利用各種技術(shù)來提高其性能和效果。例如,ChatGPT可以使用文本生成微調(diào)技術(shù)來進(jìn)一步改進(jìn)其生成答案的能力。而且ChatGPT 還可以使用多模態(tài)數(shù)據(jù),例如圖片和語音,來生成更加豐富和全面的回答。同時(shí),ChatGPT 還可以使用多語言技術(shù)來支持不同語言的輸入和輸出。需要注意的是,ChatGPT 的答案生成能力是有限的,它通常依賴于其預(yù)訓(xùn)練模型中包含的知識(shí)。對(duì)于一些問題,可能需要結(jié)合ChatGPT 與其他知識(shí)庫或外部信息源,才能提供更全面的回答。此外,答案生成還需要模型在不斷微調(diào)和改進(jìn)中不斷發(fā)展,以提供更高質(zhì)量的回答。
最后,需要對(duì)答案進(jìn)行評(píng)價(jià),判斷答案的準(zhǔn)確性和完整性。評(píng)價(jià)可以基于人工標(biāo)注、自動(dòng)評(píng)價(jià)指標(biāo)等多種方式進(jìn)行。例如,對(duì)于上述問題,“請(qǐng)描述人工智能技術(shù)目前的狀態(tài)和未來的發(fā)展趨勢”,可以通過專家評(píng)估或自動(dòng)評(píng)價(jià)指標(biāo),判斷生成的答案是否準(zhǔn)確、完整。同時(shí),用戶也應(yīng)該需要使用多個(gè)來源渠道和資源驗(yàn)證答案的準(zhǔn)確性和可靠性。除此以外,還可以通過收集用戶反饋來評(píng)估ChatGPT 對(duì)問題回答的質(zhì)量。用戶的滿意度和反饋可以提供有價(jià)值的信息,幫助改進(jìn)模型的性能。
對(duì)于生成問題的答案需要多方考證,而ChatGPT 作為人工智能發(fā)展到一定程度的產(chǎn)物,其為教育評(píng)價(jià)提供虛擬開放的評(píng)價(jià)空間、人人平等的評(píng)價(jià)思維、數(shù)據(jù)互通的教育評(píng)價(jià)平臺(tái)等。最重要的是,人工智能時(shí)代的教育評(píng)價(jià)應(yīng)該消除主體單一、錯(cuò)位等不利影響,激發(fā)多元評(píng)價(jià)主體參與的積極性[9]。與此同時(shí),教育教學(xué)依據(jù)收集到的數(shù)據(jù)和設(shè)計(jì)好的評(píng)價(jià)指標(biāo)建立符合實(shí)際情況的評(píng)價(jià)模型,綜合運(yùn)用算法建模和數(shù)據(jù)挖掘等技術(shù)對(duì)學(xué)生的學(xué)習(xí)成果和表現(xiàn)進(jìn)行量化評(píng)價(jià)[10]。然而,我們也需要認(rèn)識(shí)到,ChatGPT在各領(lǐng)域中的應(yīng)用尚處于初始階段,技術(shù)的作用并未得到充分發(fā)揮,也并沒有實(shí)現(xiàn)真正意義上的人工智能。因此,要實(shí)現(xiàn)人工智能對(duì)于學(xué)術(shù)問題求解的應(yīng)然之態(tài),還需要夯實(shí)人工智能時(shí)代技術(shù)發(fā)展的支撐體系。
綜上所述,ChatGPT 在學(xué)術(shù)問題生成過程中其嚴(yán)密的步驟促進(jìn)了答案的有效性和準(zhǔn)確性。雖說ChatGPT 作為人工智能系統(tǒng)的功能性價(jià)值彰顯已經(jīng)無需贅述,但其是否具有原本意義上的價(jià)值生成和價(jià)值創(chuàng)造的意義仍需討論。盡管ChatGPT 在一定程度上加深了人類對(duì)于社會(huì)和未知事物的理解,但我們?nèi)孕杩紤]新一代人工智能所存在的倫理道德隱患以及其可能對(duì)社會(huì)各方面所產(chǎn)生的影響和變革,將其更好地與社會(huì)結(jié)合起來,打造一個(gè)更加和諧的人工智能時(shí)代。
本文基于ChatGPT 模型,通過提出學(xué)術(shù)問題求解的案例,分析其在學(xué)術(shù)問題求解中的優(yōu)勢和不足。ChatGPT 模型具有快速、自動(dòng)化回答問題,廣泛的知識(shí)庫,靈活性等優(yōu)點(diǎn),但也存在模型精度不夠高、受限于知識(shí)庫、無法進(jìn)行推理和思考等不足之處。在實(shí)際應(yīng)用中,我們需要結(jié)合其優(yōu)勢和不足,進(jìn)行科學(xué)合理的使用,以提高學(xué)術(shù)問題求解的效率和準(zhǔn)確性。可從以下三個(gè)方面進(jìn)行改進(jìn)。
可以考慮通過增加知識(shí)庫的規(guī)模和豐富度,提高知識(shí)的覆蓋廣度和深度;同時(shí),也可以考慮引入多模態(tài)信息(如圖片、視頻等),豐富問題和答案的表現(xiàn)形式和內(nèi)容;可以將該方法應(yīng)用到其他更廣泛的領(lǐng)域,如醫(yī)學(xué)、法律等,滿足人們對(duì)于知識(shí)的更多需求;還可以進(jìn)一步探索如何將基于ChatGPT 的學(xué)術(shù)問題求解方法與人類專家相結(jié)合,提高答案的可信度和權(quán)威性。例如,可以將模型生成的答案交由人類專家進(jìn)行審查和評(píng)估,以確保答案的正確性和可靠性。另外,ChatGPT 模型還可以通過增加數(shù)據(jù)集、優(yōu)化模型結(jié)構(gòu)等方式進(jìn)一步提高模型的性能和效果,從而更好地滿足學(xué)術(shù)領(lǐng)域的需求。此外,還可以考慮將該方法與在線教育、知識(shí)圖譜等技術(shù)結(jié)合,打造更加完整和全面的知識(shí)服務(wù)平臺(tái)??傊?,基于ChatGPT 的學(xué)術(shù)問題求解方法具有很大的應(yīng)用潛力和推廣價(jià)值,未來可以進(jìn)一步完善和優(yōu)化,滿足人們對(duì)于知識(shí)獲取和解決問題的更多需求。
在訓(xùn)練和微調(diào)ChatGPT 模型時(shí),確保使用的數(shù)據(jù)集是清潔和合法的,排除不當(dāng)、惡意或不符合倫理規(guī)范的數(shù)據(jù)。定期審查和監(jiān)控模型生成的內(nèi)容,以檢測并糾正不當(dāng)內(nèi)容,把控?cái)?shù)據(jù)的過濾和審查工作。實(shí)施文本生成的限制,以確保生成的內(nèi)容符合倫理標(biāo)準(zhǔn)。這可以包括設(shè)置最大文本長度、添加關(guān)鍵詞過濾、限制敏感內(nèi)容的生成等,有助于防止不適當(dāng)?shù)膬?nèi)容生成。與此同時(shí),ChatGPT 的運(yùn)行應(yīng)該是透明的,用戶應(yīng)該了解它是一個(gè)自動(dòng)化生成模型,提供有關(guān)模型如何工作的信息,以增加用戶對(duì)模型操作的信任。社區(qū)和利益相關(guān)者提供模型的信息,包括數(shù)據(jù)來源、訓(xùn)練方法和微調(diào)策略。公開透明性可以幫助評(píng)估模型的倫理合規(guī)性。更重要的是,在部署ChatGPT 時(shí),建立審查機(jī)制,對(duì)生成的內(nèi)容進(jìn)行人工審查或監(jiān)督學(xué)習(xí)。審查員可以干預(yù)模型生成的內(nèi)容,以確保符合倫理和法律要求。
由于讀者對(duì)快餐化出版物的強(qiáng)烈需求,機(jī)械式出版物的大量出現(xiàn)已經(jīng)是大勢所趨,這是彌補(bǔ)出版市場空缺的一個(gè)新的增長點(diǎn)。但是,機(jī)器生成內(nèi)容主要基于已有的數(shù)據(jù)和模式,而不具備創(chuàng)造新知識(shí)的能力。這意味著機(jī)器生成的內(nèi)容可能會(huì)顯得相對(duì)缺乏創(chuàng)意和原創(chuàng)性。為了使機(jī)器生成的內(nèi)容能夠更好地與傳統(tǒng)人類出版物競爭,確實(shí)需要制定兩套評(píng)價(jià)體系,以改善機(jī)器生成和人類創(chuàng)作的現(xiàn)狀。評(píng)價(jià)體系分級(jí)將有助于確保機(jī)器生成內(nèi)容的質(zhì)量,并為出版業(yè)提供了一種與傳統(tǒng)出版物并存的途徑。機(jī)器生成內(nèi)容可以填補(bǔ)市場空白,但也需要以更高的標(biāo)準(zhǔn)來評(píng)估和監(jiān)管,以滿足讀者和行業(yè)的需求。同時(shí),這也促使內(nèi)容創(chuàng)作者更好地使用技術(shù),以創(chuàng)造更有價(jià)值的出版物。此外,還可以考慮制定專門的評(píng)審標(biāo)準(zhǔn)和建立相關(guān)的認(rèn)證機(jī)構(gòu),以確保內(nèi)容的質(zhì)量和合規(guī)性。這將有助于創(chuàng)造一個(gè)更公平和透明的出版市場,同時(shí)鼓勵(lì)創(chuàng)造性思考和知識(shí)傳播。
當(dāng)今時(shí)代,隨著人工智能愈演愈熱,Chat-GPT 一經(jīng)面世便對(duì)各領(lǐng)域產(chǎn)生了顛覆性影響,現(xiàn)有研究對(duì)其進(jìn)行了全面剖析,并取得了一系列有價(jià)值的研究結(jié)果。本文基于人智交互視角,對(duì)ChatGPT 的學(xué)術(shù)問題求解過程進(jìn)行研究,發(fā)現(xiàn)該項(xiàng)人工智能技術(shù)仍不成熟,存在著知識(shí)有限、缺乏深層情感理解以及風(fēng)險(xiǎn)偏好等問題。因此,作為ChatGPT 等智能工具的創(chuàng)造者、使用者,人們要秉持“科技向善”的理念,持續(xù)改進(jìn)技術(shù),提高自身在利用人工智能生成技術(shù)上的專業(yè)素養(yǎng),積極參與人工智能技術(shù)、數(shù)據(jù)挖掘等領(lǐng)域的專業(yè)培訓(xùn),要主動(dòng)與其他部門或?qū)W科協(xié)作,應(yīng)對(duì)挑戰(zhàn),未雨綢繆,制訂規(guī)劃,為發(fā)展創(chuàng)造有利條件,使ChatGPT 能夠更好地服務(wù)人類。