,,
閱讀療法是以文獻為媒介,將閱讀作為保健、養(yǎng)生以及輔助治療疾病的手段,通過對文獻內(nèi)容的學習、討論和領悟,養(yǎng)護或恢復身心健康的一種方法[1]。它通常分為兩類:一類是治未病的閱讀療法,屬于閱讀保健、閱讀養(yǎng)生,也可以稱之為“發(fā)展閱讀療法”;另一類是治已病的閱讀療法,即選擇有治療作用的圖書供患者閱讀,達到輔助治療的目的,也可以稱之為“臨床閱讀療法”。可見,閱讀療法能夠起到無病保健養(yǎng)生,有病輔助治療的功效。
“互聯(lián)網(wǎng)+”時代,社交網(wǎng)絡平臺以更新快、信息量大、傳播廣等特點,匯集了大學生豐富的情緒表達深受他們喜愛。高校圖書館如何依托大數(shù)據(jù)分析技術(shù),對大學生讀者的海量網(wǎng)絡數(shù)據(jù)進行挖掘,及時捕捉負面情緒傾向,針對患者早期病癥實施閱讀療法,對維護大學生讀者心理健康、防止心理疾病的發(fā)生大有裨益。
用戶畫像作為大數(shù)據(jù)時代實現(xiàn)產(chǎn)品和服務精準營銷的工具之一,為高校圖書館閱讀療法工作提供了新思路。
用戶畫像,即用戶信息標簽化,最早由“交互設計之父”Alan Cooper提出,它是真實用戶的虛擬代表,是建立在一系列真實數(shù)據(jù)之上的目標用戶模型[2]。通過對用戶屬性及其行為數(shù)據(jù)進行挖掘、分析,進而提取用戶的興趣標簽,以達到了解用戶需求的目的[3]。其核心理念是按照特征為不同用戶打“標簽”,將所有標簽綜合起來,最終獲取該用戶畫像。用戶畫像最初應用在計算機和電子商務領域的產(chǎn)品設計、個性化推薦、精準營銷等方面。大數(shù)據(jù)時代圖書館領域也可以引入用戶畫像,通過分析用戶行為,為每個用戶打上標簽,了解和預測用戶需求,實現(xiàn)服務的個性化和精準化。
國外閱讀療法研究主要側(cè)重于心理學、醫(yī)學等領域,研究者從不同側(cè)面對閱讀療法進行綜述。McCulliss探討了閱讀療法對促進心理健康的作用,對閱讀療法課程開設和培訓項目提出了建議[4];Brewster總結(jié)了英國閱療書方模式[5]。國外文獻的研究內(nèi)容主要包括對閱讀療法的態(tài)度、文獻選擇標準、閱讀療法應用與療效評價3方面。
國內(nèi)閱讀療法研究起步晚于國外,理論研究集中在閱讀療法機制、閱讀療法應用與療效評價、閱讀療法實施策略3方面。宮梅玲采用貝克抑郁自評量表對部分在校大學生進行抑郁狀況調(diào)查,吸收中醫(yī)方劑學配伍理論,制定了書方配伍原則[6];王波列出了包括心理健康教育等內(nèi)容的新生書目[7];楊雙琪、王景文等回顧了近幾年的兒童閱讀療法研究成果并提出了建議[8]。技術(shù)應用方面,趙曉華等結(jié)合當今大學生對自媒體的運用,探討了高校圖書館基于自媒體開展閱讀療法的創(chuàng)新方式[9];韓梅花等首次將用戶畫像應用在抑郁癥閱讀療法的研究中[10]。
綜合國內(nèi)外已有研究,用戶畫像能為用戶提供個性化、精準化的信息推薦及服務。將用戶畫像及智能推薦技術(shù)引入到閱讀療法實踐中,不僅能保護患者隱私、維護患者尊嚴,而且創(chuàng)新發(fā)現(xiàn)患者機制,突破受眾范圍,促進閱讀療法精準、快速、廣泛地開展。但目前閱讀療法實施對象的選取方法過于單一,私密性差,利用新技術(shù)創(chuàng)新性開展閱讀療法的研究尚待進一步加強。在移動互聯(lián)網(wǎng)和大數(shù)據(jù)時代背景下,閱讀療法只有創(chuàng)新服務模式,才能適應時代發(fā)展。
因此,筆者提出了基于用戶畫像的高校圖書館閱讀療法模式。通過對大學生讀者微博、博客等網(wǎng)絡文本進行情緒分析,觀察他們的情緒變化曲線,為不同讀者構(gòu)建情緒畫像,針對患者早期病癥推送閱讀資源,力求為“互聯(lián)網(wǎng)+”環(huán)境下大數(shù)據(jù)時代閱讀療法工作提供新的視角。
情緒詞典是帶有情緒色彩的詞或詞組組成的集合,是對文本進行情緒分析的重要資源。人們在文本表達中選擇的詞匯往往帶有主觀傾向性,體現(xiàn)出他們當時的情緒狀態(tài),這些帶有情緒色彩的詞匯是進行情緒分析的重要線索。
目前,HowNet和C-LIWC是被廣泛應用的情緒詞典[11],然而它們無論是在規(guī)模還是在針對性方面都存在局限性,尚不能識別更加細致的情緒類別。大學生在微博、博客等網(wǎng)絡文本中喜歡使用大量的網(wǎng)絡詞匯,如“么么噠”“扎心”“藍瘦香菇”等帶有情緒色彩的網(wǎng)絡用語,但現(xiàn)有的情緒詞典無法匹配不斷更新的網(wǎng)絡詞匯,影響情緒分析的準確性。
因此,擴充情緒詞典勢在必行,從微博文本中獲取將是重要途徑。大數(shù)據(jù)時代,隨著信息技術(shù)的發(fā)展,基于機器學習擴充情緒詞典省時省力,準確度較高,已成為主流方向。將HowNet中文正負面情緒詞典作為基礎情緒詞典,首先獲取微博語料并進行預處理,為后續(xù)分析工作做準備,然后利用Word2vec(Word to vector)模型分析這些新詞的情緒傾向,最終確定帶有情緒色彩的新詞,將它們加入到基礎情緒詞典中。具體流程如下。
2.1.1 獲取微博語料并進行預處理
首先爬取微博賬號發(fā)表過的微博以及所有評論文本,清除噪聲信息并進行分詞處理,包括去除重復文本、停用詞等,但要保證表情符號對應的代碼以及顏文字不被切分。
2.1.2 基于Word2vec計算詞語相似度
Word2vec(Word to vector)是2013年谷歌開發(fā)的一種用于訓練詞向量學習工具,提供了distance函數(shù),可以分析出所查詢詞語的相關(guān)詞語列表。根據(jù)獲取的微博語料,依次輸入基礎情緒詞典中各個類別的詞匯,通過優(yōu)化的訓練模型快速有效地用K維向量表示微博文本,對微博及評論等語料進行相似度計算。由于微博語料的獲取呈動態(tài)性,擴充詞典時應采用迭代方式,即將上一輪語料擴展輸出的詞典作為下一輪擴展的情緒詞典,同時注入新的微博語料,實現(xiàn)詞典的增量式擴展。
2.1.3 情緒詞篩選
通過Word2vec擴展獲得的詞語可能存在準確度不高的問題,因此需要對擴展后的詞典進行基于HowNet詞典的自動篩選和人工篩選。借助HowNet計算擴展出來的詞語與種子詞的相似度,按照高低排序篩選相似度高的詞語。由于HowNet更新具有一定滯后性,不能通過計算相似度篩選候選詞,因此通常采用以下方法:如果某詞語沒有出現(xiàn)在HowNet詞典中,則默認為新詞保留;如果出現(xiàn)在HowNet詞典中但相似度小于指定閾值,則剔除該詞。最后通過人工判斷其類別。
2.2.1 大學生讀者用戶畫像數(shù)據(jù)獲取
圖書館構(gòu)建用戶畫像首先要對大學生讀者的屬性數(shù)據(jù)和行為數(shù)據(jù)進行初步刻畫。大學生讀者的基本信息包括姓名、年級、專業(yè)、年齡等,這些信息相對穩(wěn)定,可稱之為靜態(tài)信息;行為數(shù)據(jù)主要包括圖書館管理系統(tǒng)、移動社交平臺(微信、微博)等個人網(wǎng)絡行為數(shù)據(jù)、互動數(shù)據(jù)等,這些不斷變化的信息記錄了讀者瀏覽、搜索、轉(zhuǎn)發(fā)、評論等行為軌跡,屬于動態(tài)數(shù)據(jù)。在圖書館用戶管理系統(tǒng)中采集讀者的屬性數(shù)據(jù),通過移動終端、網(wǎng)站系統(tǒng)識別網(wǎng)絡行為數(shù)據(jù),還可以利用網(wǎng)絡爬蟲技術(shù)追蹤讀者在全網(wǎng)的行為信息。
2.2.2 根據(jù)情緒詞典進行情緒分析
圖書館用戶畫像獲取是一個逐步完善的過程。以移動社交平臺新浪微博為例,通過搜索關(guān)鍵字爬取某個讀者的微博文本,然后基于詞典對微博文本進行情緒分析。具體過程如下。
2.2.2.1 文本預處理
首先刪除掉廣告、重復文本,然后利用分詞系統(tǒng)導入擴充的情緒詞典進行文本分詞,如去掉停用詞和與感情無關(guān)的字符。
2.2.2.2 提取情感特征詞
選取情緒詞典里的詞作為該條微博文本的情感特征詞,構(gòu)建文本的情感特征向量。
2.2.2.3 賦予情緒詞權(quán)值
由于文本情緒強度受句法結(jié)構(gòu)、語境等因素影響較大,因此要對情緒詞典的每個詞語賦予權(quán)值1,以減少單個詞語對文本情緒強度的影響。針對文本中出現(xiàn)多個同類別情緒詞語,加權(quán)計算對應的向量維度值。
2.2.2.4 程度詞和否定詞的特殊處理
如果情感特征詞前有程度詞,則將程度強度劃分等級并賦予相應權(quán)值。情感特征詞的權(quán)重應該為程度詞與特征詞的權(quán)重之積,被否定詞修飾的情緒詞通常會改變情緒傾向,統(tǒng)計否定詞的個數(shù)并設定每個否定詞的權(quán)重為-1,情感特征詞的權(quán)重應該是N個-1與特征詞權(quán)重之積。
2.2.2.5 計算和選取微博文本的情緒類別
根據(jù)單條微博文本的情緒類別,計算其對應的情感特征詞權(quán)值之和,選取權(quán)值最大的作為該微博文本的情緒類別。
通過計算得出每條微博文本情感特征向量后,選取權(quán)值最大的特征項作為該微博文本的最終情緒傾向,形成該用戶的情緒畫像。
自古以來,中醫(yī)重視非藥物的情志調(diào)攝方法,尤其重視調(diào)暢情志的心理療法[12]。閱讀療法作為心理療法的一種方式,最早為醫(yī)學界用語,其中閱療書方的選擇是最有技術(shù)性的環(huán)節(jié)。
高校圖書館通過情緒分析獲取讀者情緒畫像后,根據(jù)患者負面情緒傾向,利用現(xiàn)有的信息推送技術(shù),向其自動推送具有最佳治療功效的的閱讀資源,如心理自助類圖書、勵志類小說、哲學類圖書等。在同類圖書中,精心挑選針對問題最全面最權(quán)威的經(jīng)典之作。在閱讀過程中,患者通過與作者的情感交流,將積壓在內(nèi)心深處的煩躁、苦悶、焦慮等負面情緒消滅在潛意識層里,找到自身存在的問題和解決辦法,恢復平和的心態(tài)。另外,社交媒體作為大學生溝通情感和獲取信息的重要途徑,不僅宣泄了情緒,而且也增進了友誼,疏通了心理郁結(jié),達到療傷止痛的目的。
“互聯(lián)網(wǎng)+”時代,基于用戶畫像的高校圖書館閱讀療法模式為高校圖書館閱讀療法工作帶來了新的發(fā)展機遇。一方面,通過對讀者的網(wǎng)絡文本數(shù)據(jù)進行情緒分析獲取讀者的情緒畫像,及時發(fā)現(xiàn)潛在患者,把握治療時機,提供精準化閱讀療法,能夠起到“有病輔助治療、無病保健養(yǎng)生”的目的;另一方面,基于用戶畫像的高校圖書館閱讀療法的實踐,豐富了閱讀療法理論,必將促進閱讀療法研究的深入。